第一個在鐵人賽度過的生日~~哈哈哈
相信付出的學習時間會有收穫的時候!!讓我們進入今日的主題吧!
在處理資料分析上當然少不了已完善的強大功能模組,Pandas便是其中之一.
Pandas是python的一個數據分析模組,2009 年底開源出來,提供高效能、簡易使用的資料格式(Data Frame)讓使用者可以快速操作及分析資料,Pandas強化了資料處理的方便性也能與處理網頁資料與資料庫資料等,有點類似於Office的Excel能更加方便的進行運算、分析等.
使用Anaconda一樣參照day3於環境中添加Pandas模組,預設是沒有安裝的,安裝完畢後就能引用模組到程式中,大部分都會將Pandas另外命名成pd
方便使用,如下範例:
import pandas as pd
Pandas提供以下三種資料結構供使用:
主要針對較為常使用的Series、DataFrame 進行介紹
Series基本上是能將一維度的資料加上索引值,這索引值不局限於0、1、2、3數值形式,也能增加日期、文字索引,並能透過索引方式進行資料切片,也可使用函數對值進行運算.
DataFrame用來處理結構化(Table like)的資料,有列索引與欄標籤的二維資料集,可以透過Dictionary或是 Array來建立,就像是Excel一樣具備欄與列的概念可形成完整表格形式,也可以利用外部的資料來讀取後來建立,像是資料表資料或csv檔案等.
以上,是Pandas基本認知,下篇文章我們將針對常用的Series進行學習,
參考文章:https://medium.com/@yehjames/%E8%B3%87%E6%96%99%E5%88%86%E6%9E%90-%E6%A9%9F%E5%99%A8%E5%AD%B8%E7%BF%92-%E7%AC%AC2-3%E8%AC%9B-pandas-%E5%9F%BA%E6%9C%ACfunction%E4%BB%8B%E7%B4%B9-series-dataframe-selection-grouping-447a3fa90b60
參考文章:https://oranwind.org/python-pandas-ji-chu-jiao-xue/
文章內容如果有錯誤歡迎留言告知,可以幫忙糾正錯誤的觀念,感謝!