今天的內容是 Python Pandas 資料分析 - Series 單維度資料,也就是在昨天的基礎上再多一些的內容,以下附上網址:
https://www.youtube.com/watch?v=175ZZC3Hr0Y&list=PL-g0fdC5RMboYEyt6QS2iLb_1m7QcgfHk&index=24&t=0s
資料索引:
1.1 什麼是資料索引。
1.2 內建的資料索引。
1.3 自訂的資料索引。
觀察資料:
2.1 資料型態。
2.2 資料數量。
2.3 資料索引。
數字資料的運算:
3.1 數學運算:最大最小值,加法總和,乘法總和。
3.2 統計運算:平均數,中位數,標準差。
3.3 排序運算:最大的 n 個數字、最小的 n 個數字。
字串資料的運算:
4.1 轉換成大小寫。
4.2 串接字串。
4.3 字串長度。
4.4 搜尋字串中是否包含其他字串。
4.5 取代字串中的文字。
-載入 pandas 模組
import pandas as pd
-資料索引
data=pd.Series([5,4,-2,3,7], index=["a","b","c","d","e"]) # 建立一個 Series 的資料,並自行建立索引
print(data)
-觀察資料
print("資料型態",data.dtype)
print("資料數量",data.size)
print("資料索引",data.index)
-取得資料:根據順序、根據索引
print(data[2]) # 取得編號 2:第三筆的資料
print(data["e"]) # 取得索引 e 的資料
-數字運算:基本、統計、順序
print("最大值", data.max())
print("總和", data.sum())
print("標準差", data.std())
print("中位數", data.median())
print("最大的三個數", data.nlargest(3))
-字串運算: 基本、串接、搜尋、取代
data=pd.Series(["您好","Python","Pandas"])
print(data.str.len()) # 計算出字串的長度
print(data.str.lower()) # 將字串全部變小寫
print(data.str.cat(sep=",")) # 將字串串接起來,並用逗點進行連接
print(data.str.contains("P")) # 判斷字串中是否有包含大寫 P
print(data.str.replace("您好","Hello")) # 將"您好"更換為"Hello"
其實今天的內容也不算非常難,不過完全學會也還遠不及自行統計分析的地步,教學影片到目前為止也就告一個段落了,接著我會試試看自行分析一些政府的開放式資料,還有網路爬蟲的地方我也卡住還沒有開工,後續會再試著找找看其他的方法。