今天也是彭彭老師的影片,主題是 Pandas 資料分析-基礎教學,以下附上網址:
https://www.youtube.com/watch?v=5QZqzKCDCQ4&list=PL-g0fdC5RMboYEyt6QS2iLb_1m7QcgfHk&index=23&t=640s
認識、安裝 Pandas
1.1 類似試算表的程式化資料分析工具
1.2 安裝方法 pip install pandas
關鍵概念 Series
2.1 認識單維度資料
2.2 建立 Series
2.3 操作 Series (最大值、中位數、基本運算)
關鍵概念 DataFrame
3.1 認識雙維度資料
3.2 建立 DataFrame
3.3 操作 DataFrame (取得欄或列)
-載入 pandas 模組
import pandas as pd # 載入 pandas 模組供後續使用
-建立 Series
data=pd.Series([20,10,15]) # 建立出一個 Series
-基本 Series 操作
print(data) # 顯示出 Series 裡面的資料
print("Max =",data.max()) # 顯示出 Series 裡面的 Max
print("Median =",data.median()) # 顯示出 Series 裡面的 Median
data=data*2 # 將 Series 裡面的資料全部*2
print(data) # 成功的話將會顯示 40,20,30
data=data==20 # 按照要求進行判斷資料是不是為 20,會顯示出 False,True,False
print(data)
-建立 DataFrame
data=pd.DataFrame({
"name":["Amy","John","Bob"],
"salary":[30000,50000,40000]
})
print(data)
-基本 DataFrame 操作
--取得特定的欄位
print(data["name"]) # 只取得 name 欄位的資料
print(data["salary"]) # 只取得 salary 欄位的資料
--取得特定的列
print(data.iloc[0]) # 印出第一列
今天的主題是資料分析的基礎內容,因此可以看得出來內容很簡單,和之前的統計分析差不多的程度而已,不過後續還有進階的內容,因此還是要好好的熟悉運作才行。