這次是在我開始就業後首次參加 IT 鐵人賽,由於工作上較常使用到 pandas,而且 pandas 在處理資料上也經常被使用,俗稱為 Python 版的 Excel,所以想說以 pandas 當作主題,順便檢驗是否有更了解自己學習的技能。
決定選用的書為 Wes McKinney 的「Python 資料分析,使用 pandas、NumPy 和 Jupyter 進行資料整理」。
特別值算術運算 使用兩個索引不完全相同的物件來做算術運算時,假如想在軸標籤其中一個物件中找到時填入特別值,例如 0。 將一個特定值設為 np.nan 來將他設...
DataFrame 與 Series 之間運算 與不同維數的 NumPy 陣列相同,pandas 也定義 DataFrame 與 Series 之間的算術運算...
排序 (上) 使用某個條件來排序資料組是另一個重要的內建操作,若要按照辭典順序來排序或是欄標籤,可以使用 sort_value() 方法,它會回傳一個排序好的...
排序 (下) 我們接續上次排序的內容,在預設情況下,所有缺失值都會排在 Series 的結尾: In [244]: obj = pd.Series([4, n...
排名 (上) 排名(ranking)會指定排名,排名 1 到陣列的有效資料點數量為止,最小值為 1,可以使用 Series 與 DataFrame 的 ran...
排名 (下) 我們接續上次排名的內容,可以使用降序排名: In [254]: obj.rank(ascending=False) Out[254]: 0...
重複標籤 目前看到的範例都有互不相同的軸標籤 (索引值),雖然有很多 pandas 函式如 reindex 都要求標籤互不相同,但並非強制規定,假如是一個具有...
總結與計算描述性統計數據 pandas 物件具備一組常用的數學和統計方法,他們大多是歸約或總結統計方法,可以從 Series 提取一個值(如 sum() 與...
唯一值、值的數量以及成員資格 有一類相關的方法可以提取關於一維 Series 的值資訊: In [290]: obj = pd.Series(["c...
資料載入 pandas 有些函式可將表個資料讀為 DataFrame 物件,read_csv 為最常用的一種: read_csv :從檔案、URL或類檔案物件...