在進行大量的資料處理時,有時會需要取得符合特定條件的資料,以利後續的觀察與操作,此時就會使用到資料篩選和過濾的技能,今天將以案例搭配 loc[] 函數和大家...
完成資料篩選後,我們可以針對特定欄位進行排序,幫助我們快速整理與觀察,以下將透過案例替大家介紹兩種資料排序的方式,內容包含: 根據數值(value)排序...
嗨!大家好!了解完如何載入和觀察資料後,接著將開始一系列對資料內容的操作,今天的主題為「新增資料」,內容分別以Pandas兩種常見的數據結構說明,包含:...
篩選資料是分析時,常會使用到的操作方式,用來簡化及提取所需要的資料。 戶名 | 行政區 | 購屋年份 | 價格A | 松山區 | 2020/10/5 |22...
篩選資料是分析時,常會使用到的操作方式,用來簡化及提取所需要的資料。 戶名 | 行政區 | 購屋年份 | 價格A | 松山區 | 2020/10/5 |22...
資料的運算是整理大型數據常見的操作,本篇將搭配新增資料的操作,以案例分享 DataFrame 的加減乘除,方便我們利用 Pandas 快速整理數據,以下內容...
當獲得龐大複雜的資料時,我們可將資料採用groupby()函式分組,方便以不同群組角度檢視資料。 先匯入資料 from pandas.core.groupb...
當得到資料為混亂資料時,我們可使用函式將DataFrame重組成整齊的樣子。先使用stack()將所有欄位名稱旋轉成索引,再使用reset_index()來重...
Pandas套件的Pivot Table樞紐分析表可以說是進行資料統計分析時非常好用的工具之一,可以快速解讀欄位資料之間的關係。 pd.pivot_tabl...
目標:1.不同年度的電影的最高分及平均分數2.不同類型電影,近幾年的最高及平均分數 電影名稱 年份 分數 0 A電影 2020 54 1...
■ 題目|Interview Query - Rain on Rainy Days You’re given a dataframe df_rain conta...
箱形圖 假設我們有一組資料,記錄了某公司員工的月薪 月薪 | 次數 ------- | -------- 10000 | 10 15000 | 20 200...
■ 題目|Interview Query - Customer Analysis You’re given a dataframe containing sal...
在大型數據當中,有時我們會需要透過群組的方式概括整體資料,除了用以觀察之外,也能進一步深入處理,本文將分享如何使用資料的分組和聚合操作,內容包含: 資料分...
資料類型查看,為資料探索的重要第一步。 import pandas as pd df=pd.DataFrame([[8,7,6,5,4],[3,4,2,9,...
■ 題目|Interview Query - Complete Addresses You’re given two dataframes. One conta...
前言 大家好~ 金融業打滾了幾些年,一直覺得IT產業及電腦就是充滿著神秘色彩&無限可能,加上今年徹底被AI給震撼到,決定把自己當初學程式的興趣及熱情再度...
得到一份益生菌試吃一週後的問券,不同職業、身高、體重的人食用後的滿意度調查結果。 滿意度 職業 身高 體重 0 8 律師 165 54 1 5 教師 15...
Pandas 內有許多繪圖函數,plot() 是 Matplotlib 的一個函數,用於繪製圖表。它可以繪製多種不同類型的圖表,包括折線圖、散點圖、柱狀圖、直...
■ 題目|Interview Query - Impute Median You’re given a dataframe df_cheeses contain...
目標:1.不同年度中電影分數最高的導演2.不同導演的平均評分及統計分佈(使用groupby())3.不同種類電影的平均評分及統計分佈(使用groupby())...
在昨天標籤編碼法(Label Encoding)的舉例中,我們可以透過 sklearn 中的函數 LabelEncoder 將類別型態轉為數值型態,那大家是...
之前我們已學過了Series串連,本次是DataFrame串連,目標則是為了知道每個步驟中傳回確切物件。 使用isna()判斷是否為缺失值,其傳回為布林值...
若想要處理排名類型的資料集,可適用此做法來資料分析。 電影名稱 預算(千萬) 分數 0 A電影 165 54 1 B電影...
直方圖 直方圖中的每個條形表示數據中值的出現次數。在這個例子中,我們可以看到數據分布在 0 到 100 之間。 import pandas as pd im...