iT邦幫忙

pandas相關文章
共有 175 則文章
鐵人賽 自我挑戰組 DAY 10

技術 Day 10|資料的篩選與過濾

  在進行大量的資料處理時,有時會需要取得符合特定條件的資料,以利後續的觀察與操作,此時就會使用到資料篩選和過濾的技能,今天將以案例搭配 loc[] 函數和大家...

鐵人賽 自我挑戰組 DAY 11

技術 Day 11|資料快速排序操作

  完成資料篩選後,我們可以針對特定欄位進行排序,幫助我們快速整理與觀察,以下將透過案例替大家介紹兩種資料排序的方式,內容包含: 根據數值(value)排序...

鐵人賽 自我挑戰組 DAY 7

技術 Day 7|新增 Series 或 DataFrame

  嗨!大家好!了解完如何載入和觀察資料後,接著將開始一系列對資料內容的操作,今天的主題為「新增資料」,內容分別以Pandas兩種常見的數據結構說明,包含:...

鐵人賽 自我挑戰組 DAY 10

技術 Day10- 資料探索(3)資料篩選

篩選資料是分析時,常會使用到的操作方式,用來簡化及提取所需要的資料。 戶名 | 行政區 | 購屋年份 | 價格A | 松山區 | 2020/10/5 |22...

鐵人賽 自我挑戰組 DAY 10

技術 Day10- 資料探索(3)資料篩選

篩選資料是分析時,常會使用到的操作方式,用來簡化及提取所需要的資料。 戶名 | 行政區 | 購屋年份 | 價格A | 松山區 | 2020/10/5 |22...

鐵人賽 自我挑戰組 DAY 8

技術 Day 8|資料運算的加減乘除

  資料的運算是整理大型數據常見的操作,本篇將搭配新增資料的操作,以案例分享 DataFrame 的加減乘除,方便我們利用 Pandas 快速整理數據,以下內容...

鐵人賽 自我挑戰組 DAY 17

技術 Day17- 資料探索(10)資料分組

當獲得龐大複雜的資料時,我們可將資料採用groupby()函式分組,方便以不同群組角度檢視資料。 先匯入資料 from pandas.core.groupb...

鐵人賽 自我挑戰組 DAY 13

技術 Day13- 資料探索(6)資料重整

當得到資料為混亂資料時,我們可使用函式將DataFrame重組成整齊的樣子。先使用stack()將所有欄位名稱旋轉成索引,再使用reset_index()來重...

鐵人賽 自我挑戰組 DAY 21

技術 Day21- 資料分析(4)樞紐分析

Pandas套件的Pivot Table樞紐分析表可以說是進行資料統計分析時非常好用的工具之一,可以快速解讀欄位資料之間的關係。 pd.pivot_tabl...

鐵人賽 自我挑戰組 DAY 22

技術 Day22- 資料分析(5)電影樞紐

目標:1.不同年度的電影的最高分及平均分數2.不同類型電影,近幾年的最高及平均分數 電影名稱 年份 分數 0 A電影 2020 54 1...

鐵人賽 自我挑戰組 DAY 26

技術 Day 26|Interview Query - Rain on Rainy Days

■ 題目|Interview Query - Rain on Rainy Days You’re given a dataframe df_rain conta...

鐵人賽 自我挑戰組 DAY 29

技術 Day29- 視覺化呈現(4)箱形分析

箱形圖 假設我們有一組資料,記錄了某公司員工的月薪 月薪 | 次數 ------- | -------- 10000 | 10 15000 | 20 200...

鐵人賽 自我挑戰組 DAY 29

技術 Day 29|Interview Query - Customer Analysis

■ 題目|Interview Query - Customer Analysis You’re given a dataframe containing sal...

鐵人賽 自我挑戰組 DAY 18

技術 Day 18|資料的分組和聚合

  在大型數據當中,有時我們會需要透過群組的方式概括整體資料,除了用以觀察之外,也能進一步深入處理,本文將分享如何使用資料的分組和聚合操作,內容包含: 資料分...

鐵人賽 自我挑戰組 DAY 8

技術 Day8- 資料探索(1)資料查看

資料類型查看,為資料探索的重要第一步。 import pandas as pd df=pd.DataFrame([[8,7,6,5,4],[3,4,2,9,...

鐵人賽 自我挑戰組 DAY 28

技術 Day 28|Interview Query - Complete Addresses

■ 題目|Interview Query - Complete Addresses You’re given two dataframes. One conta...

鐵人賽 自我挑戰組 DAY 1

技術 Day1- 前言

前言 大家好~ 金融業打滾了幾些年,一直覺得IT產業及電腦就是充滿著神秘色彩&無限可能,加上今年徹底被AI給震撼到,決定把自己當初學程式的興趣及熱情再度...

鐵人賽 自我挑戰組 DAY 18

技術 Day18- 資料分析(1)問券調查

得到一份益生菌試吃一週後的問券,不同職業、身高、體重的人食用後的滿意度調查結果。 滿意度 職業 身高 體重 0 8 律師 165 54 1 5 教師 15...

鐵人賽 自我挑戰組 DAY 26

技術 Day26- 視覺化呈現(1)函式介紹

Pandas 內有許多繪圖函數,plot() 是 Matplotlib 的一個函數,用於繪製圖表。它可以繪製多種不同類型的圖表,包括折線圖、散點圖、柱狀圖、直...

鐵人賽 自我挑戰組 DAY 27

技術 Day 27|Interview Query - Impute Median

■ 題目|Interview Query - Impute Median You’re given a dataframe df_cheeses contain...

鐵人賽 自我挑戰組 DAY 23

技術 Day23- 資料分析(6)績效分析

目標:1.不同年度中電影分數最高的導演2.不同導演的平均評分及統計分佈(使用groupby())3.不同種類電影的平均評分及統計分佈(使用groupby())...

鐵人賽 自我挑戰組 DAY 16

技術 Day 16|自定義轉換必學的apply()函數

  在昨天標籤編碼法(Label Encoding)的舉例中,我們可以透過 sklearn 中的函數 LabelEncoder 將類別型態轉為數值型態,那大家是...

鐵人賽 自我挑戰組 DAY 16

技術 Day16- 資料探索(9)串連方法

之前我們已學過了Series串連,本次是DataFrame串連,目標則是為了知道每個步驟中傳回確切物件。 使用isna()判斷是否為缺失值,其傳回為布林值...

鐵人賽 自我挑戰組 DAY 19

技術 Day19- 資料分析(2)電影排名

若想要處理排名類型的資料集,可適用此做法來資料分析。 電影名稱 預算(千萬) 分數 0 A電影 165 54 1 B電影...

鐵人賽 自我挑戰組 DAY 27

技術 Day27- 視覺化呈現(2)圖形介紹

直方圖 直方圖中的每個條形表示數據中值的出現次數。在這個例子中,我們可以看到數據分布在 0 到 100 之間。 import pandas as pd im...