Hi大家好,我是Hilda。這是30天挑戰賽的第一天。最近換了新工作,新工作用到大量的Pandas,在AI的輔助下算是得以快速完成需求,雖然如此卻總覺得用得朦朦...
What is Pandas Pandas是用來創建和操作結構化資料的Python函式庫。什麼是結構化資料?簡單來說就是excel或資料庫中的表格資料。不管是資...
Pandas的資料結構有兩種Series:一維資料,你可以當它是一個陣列DataFrame:二維資料,一個有列(row)和欄位(column)的表格每一個Co...
昨天說到如何新增一個DataFrame,也說到每個一欄位都是一個series,接下來不能免俗的要介紹欄位的修改,這個在Pandas中最常見的操作,身為靈活的功夫...
昨天介紹了欄位的新增修改,明天打算介紹條件篩選。在進入條件篩選之前,先插個花介紹一些基於series的常用操作。 抓出N筆資料 head(N) 列出前面N筆資...
條件過濾是我們在處理資料最常遇到的需求~ 先準備一下今天要用到的data。做一個很常見的成績表。 df = pd.DataFrame({"name&q...
今天Focus在csv和excel的處理。明天介紹JSON。 Pandas是一種in-memory工具,也就是讀檔需要先把資料存在到記憶體,所以書上建議系統的記...
JSON的讀取方式和csv、excel有點不同,所以拉出來獨立一篇,當然也是昨天寫到excel就已經11:50了,沒有摳打可以讓我再展開講講。 在進入讀取之前,...
as title 今天的主題是index和排序。 Index index是指欄與列的標籤系統,在運算、join/merge前,pandas會用索引標籤來做資料對...
Groupby是資料分析中最基本的工作,先將資料分組再做統計運算。這種機制存在已久,稱為split-apply-combine,也就是把資料按鍵分組 (Spli...