iT邦幫忙

2025 iThome 鐵人賽

DAY 30
1
佛心分享-讓我升級的那些書

菜雞學習 pandas 的 30 日讀書分享系列 第 30

菜雞學習 pandas 的 30 日讀書分享【Day 30】資料載入

  • 分享至 

  • xImage
  •  

https://ithelp.ithome.com.tw/upload/images/20250828/20168290pjXiUMoAFB.jpg

資料載入

pandas 有些函式可將表個資料讀為 DataFrame 物件,read_csv 為最常用的一種:

read_csv :從檔案、URL或類檔案物件載入使用分隔符號的資料,預設的分隔符號為逗號。
read_fwf :讀取定寬欄位格式的資料 (不使用分隔符號)。
read_clipboard :read_csv 的變體,從剪貼簿讀取資料,適合用來轉換網頁的表格。
read_excel :從 Excel XLS 或 XLSX 檔讀取表格資料。
read_hdf :讀取用 pandas 寫入的 HDF5 檔。
read_html :讀取指定的 HTML 文件中的所有表格。
read_json :從 JSON 字串格式、檔案、URL 或類檔案物件讀取資料。
read_feather :讀取 Feather 二進制檔案格式。
read_orc :讀取 Apache ORC 二進制。
read_parquet :讀取 Apache Parquet 二進制檔案格式。
read_pickle :使用 Python pickle 格式來讀取以 pandas 儲存的物件。
read_spss :讀取用 SPSS 建立的資料檔。
read_sql :讀取 SQL 查詢的結果 (SQLAlchemy)
read_sql_table :讀取整個 SQL 表,相當於使用 read_sql 查詢指令來選擇那張表的所有東西。
read_stata :從 Stata 檔格式讀取資料組。
read_xml :從 XML 讀取資料表格。

這些函式的功能是將文字資料轉換成 DataFrame,選用引數可分成幾類:

檢索

可以使用 DataFrame 的形式回傳一欄或多欄,可能從檔案取得欄名、從提供的引數取得欄名,或完全不取得欄名。

型態推論與資料轉換

包括由用戶定義的轉換,以及自訂的缺失值標記清單。

日期與時間解析

包括合併功能,例如分散在多欄位之間的日期與時間資訊合併成一欄位。

迭代

迭代許多大型檔案。

這次的分享就到這囉,有緣再見,假如無法見到你,那麼祝你早安、午安還有晚安!


上一篇
菜雞學習 pandas 的 30 日讀書分享【Day 29】唯一值、值的數量以及成員資格
系列文
菜雞學習 pandas 的 30 日讀書分享30
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言