嗨!今天是第六天了,聖誕快樂啊!上一篇開始,介紹了數據分析會使用到的幾個package,包含: Pandas Numpy Matplotlib SciPy...
嗨,時間來到第11天了!我們在昨天(Day10)提到了groupby,第9天說明了索引的操作,那今天要繼續index這個主題繼續延伸說明多層索引! 首先要開始之...
做數據分析時,我們可能會很常使用jupyter notebook來操作並且可能依照個人喜好來使用像是seaborn、matplotlib等工具把資料視覺化但是如...
繼續上一章資料處理 Python Pandas 好用的function - Part 2我們繼續討論一下pandas有用的functions吧。 #1df.fi...
如題,有下載pip install pandaspip install pandas_datareaderpip install yfinance在沒有反應後,...
對於任何正在使用Python進行數據分析或希望學習Python進行數據分析的人來說,pandas模塊是你希望立即學習的最適合初學者的模塊之一。 它具有許多用戶友...
前言 這本書主要是在 Python 中操作、處理、清理和處理資料的各種細節,雖然本書的名字裡有「資料分析」,但本書的重點仍然是 Python 程式設計、程式庫...
為什麼要使用 Python 來分析資料? 對很多人而已,使用 Python 來設計程式有很強的吸引力。 自 1991 年問世以來,Python、Perl、Ru...
執行 Jupyter Notebook notebook 是 Jupyter 專案的主要元素之一,它是一種互動式文件,可容納程式碼、文字、Markdown 語...
重要的 Python 程式庫 (上) 主要為不熟悉 Python 資料生態的所使用的程式庫,做一個簡單的介紹。 NumPy NumPy 是 Numerical...
重要的 Python 程式庫 (下) 接續上次的內容繼續介紹 Python 所使用的程式庫。 matplotlib matplotlib 是經常用於繪製圖表和...
DataFrame (三) pandas 回傳的 Series 的索引和 DataFrame 的索引一樣,而且會適當的設定 name 屬性。 可以使用特殊的...
DataFrame (二) 接續上次的話題,如果指定一系列的欄 (column),DataFrame 的欄將按照那個順序來排列: In [53]: pd.Da...
DataFrame (五) 可傳給 DataFrame 建構式的資料輸入 2D ndarray: 資料矩陣,可傳遞列與欄標籤。 陣列、串列或是 tuple...
pandas 資料結構 在開始使用 pandas 之前,必須先知道兩個主要資料結構,Series 與 DataFrame。 Series Series 是一維...
Series (上) 接續上次的內容,Series 也可以視為一個長度固定且有序的字典,因為它儲存索引值和資料值的對映關係,它可以在許多適合使用字典的情況下使...
DataFrame (一) DataFrame 是一種矩形的資料表,裡面有許多有序的、有名稱的直欄 (column),每一欄都可以使用不同的值型態 (數字、字...
reindex (重設索引) 下 可使用 columns 關鍵字來 reindex 直欄: In [109]: state = ["Texas&qu...
Series (下) 接續上一次的內容,Series 在許多應用還有一個好用的特性,在進行算術運算時,會自動按照索引標籤對齊: In [40]: obj3 O...
檢索、選擇與篩選 Series 檢索 obj[...] 的工作方式類似 NumPy 的陣列檢索,但可以使用 Series 的索引值,而不是只能使用整數。 In...
DataFrame (四) del 關鍵字可以刪除欄位。例如,加入新的一欄,裡面儲存 state 欄是否等於 Ohio 的布林值: In [68]: fram...
loc 與 iloc DataFrame 與 Series 相同,有特殊的屬性 loc 和 iloc,分別搭配標籤和整數來檢索。 因為 DataFrame 是...
排名 (下) 我們接續上次排名的內容,可以使用降序排名: In [254]: obj.rank(ascending=False) Out[254]: 0...
排序 (上) 使用某個條件來排序資料組是另一個重要的內建操作,若要按照辭典順序來排序或是欄標籤,可以使用 sort_value() 方法,它會回傳一個排序好的...
排序 (下) 我們接續上次排序的內容,在預設情況下,所有缺失值都會排在 Series 的結尾: In [244]: obj = pd.Series([4, n...
從一軸移除項目 如果要將一軸的項目或是多個項目移除,而且已經有不含那些項目的索引陣列或串列,可以使用 reindex 方法,或使用 .loc 來檢索,這些做法...
排名 (上) 排名(ranking)會指定排名,排名 1 到陣列的有效資料點數量為止,最小值為 1,可以使用 Series 與 DataFrame 的 ran...
特別值算術運算 使用兩個索引不完全相同的物件來做算術運算時,假如想在軸標籤其中一個物件中找到時填入特別值,例如 0。 將一個特定值設為 np.nan 來將他設...
重複標籤 目前看到的範例都有互不相同的軸標籤 (索引值),雖然有很多 pandas 函式如 reindex 都要求標籤互不相同,但並非強制規定,假如是一個具有...
DataFrame 與 Series 之間運算 與不同維數的 NumPy 陣列相同,pandas 也定義 DataFrame 與 Series 之間的算術運算...