iT邦幫忙

pandas相關文章
共有 175 則文章

技術 [Python爬蟲] Pandas模組

[Python爬蟲] Pandas 模組 Python 的 Pandas 是一個強大的資料分析工具包,讓你能夠輕鬆地處理和分析結構化數據。以下是一個基本的 P...

技術 Python: pandas + gpt3.5 用一句話讓 LLM 分析數據

介紹 pandas-ai 是一個開源套件,能夠讓使用者用 Prompt 的方式請 LLM 幫忙分析 DataFrame (等價於excel) 裡面的數據。 使用...

鐵人賽 自我挑戰組 DAY 30

技術 Day30- 視覺化呈現(5)熱力分析

熱力圖 假設一組資料,記錄了某公司員工的銷售業績和客戶滿意度: 銷售業績 | 客戶滿意度 ------- | -------- 100 | 90 200 |...

鐵人賽 自我挑戰組 DAY 30

技術 Day 30|Pandas 完賽!

嗨!大家好!我是Eva!一位正努力跨進資料科學領域的女子!沒想到寫著寫著 30 天的日子就這樣過去了,能完成挑戰實在太感動了 😭 ■ 系列回顧 在這 30 天挑...

鐵人賽 自我挑戰組 DAY 29

技術 Day 29|Interview Query - Customer Analysis

■ 題目|Interview Query - Customer Analysis You’re given a dataframe containing sal...

鐵人賽 自我挑戰組 DAY 29

技術 Day29- 視覺化呈現(4)箱形分析

箱形圖 假設我們有一組資料,記錄了某公司員工的月薪 月薪 | 次數 ------- | -------- 10000 | 10 15000 | 20 200...

鐵人賽 自我挑戰組 DAY 28

技術 Day28- 視覺化呈現(3)圓餅分析

圓餅圖 假設我們有一組資料,記錄了某公司員工的職稱和人數 職稱 | 人數 ------- | -------- 經理 | 10 主管 | 20 專員 | 3...

鐵人賽 自我挑戰組 DAY 28

技術 Day 28|Interview Query - Complete Addresses

■ 題目|Interview Query - Complete Addresses You’re given two dataframes. One conta...

鐵人賽 自我挑戰組 DAY 27

技術 Day27- 視覺化呈現(2)圖形介紹

直方圖 直方圖中的每個條形表示數據中值的出現次數。在這個例子中,我們可以看到數據分布在 0 到 100 之間。 import pandas as pd im...

鐵人賽 自我挑戰組 DAY 27

技術 Day 27|Interview Query - Impute Median

■ 題目|Interview Query - Impute Median You’re given a dataframe df_cheeses contain...

鐵人賽 自我挑戰組 DAY 26

技術 Day26- 視覺化呈現(1)函式介紹

Pandas 內有許多繪圖函數,plot() 是 Matplotlib 的一個函數,用於繪製圖表。它可以繪製多種不同類型的圖表,包括折線圖、散點圖、柱狀圖、直...

鐵人賽 自我挑戰組 DAY 26

技術 Day 26|Interview Query - Rain on Rainy Days

■ 題目|Interview Query - Rain on Rainy Days You’re given a dataframe df_rain conta...

鐵人賽 自我挑戰組 DAY 25

技術 Day25- 資料分析(8)遮照分析

目標:使用 mask() & query() 函數來計算1.計算年紀大於70歲(age>70)的存活率(survived=1)2.計算年紀小...

鐵人賽 自我挑戰組 DAY 25

技術 Day 25|Interview Query - Over 100 Dollars

■ 題目|Interview Query - Over 100 Dollars You’re given two dataframes: transaction...

鐵人賽 自我挑戰組 DAY 25

技術 Day 25 - 使用 Datasets 庫 (5) - 儲存資料集和資料轉換

大概都了解 Datasets 如何以各種方式用於清理資料集。雖然 Datasets 的處理功能會涵蓋你大部分的模型訓練需求,但有的時候我們需要切換到 Panda...

鐵人賽 自我挑戰組 DAY 24

技術 Day24- 資料分析(7)報表分析

目標:求出Titanic女乘客的生還率 import seaborn as sns import numpy as np import pandas as...

鐵人賽 自我挑戰組 DAY 24

技術 Day 24|Interview Query - Good Grades and Favorite Color

  先前,我們大約花了三週的時間學習 Pandas 的操作,是時候好好驗收學習成果了!從今天開始,我將每天和大家分享一道題目,親自撰寫解法,並提出我的解題思維,...

鐵人賽 自我挑戰組 DAY 23

技術 Day23- 資料分析(6)績效分析

目標:1.不同年度中電影分數最高的導演2.不同導演的平均評分及統計分佈(使用groupby())3.不同種類電影的平均評分及統計分佈(使用groupby())...

鐵人賽 自我挑戰組 DAY 23

技術 Day 23|資料視覺化 - Seaborn

  Python 中,除了 Matplotlib 適合用於資料視覺化之外,Seaborn 也是一個好用的函式庫,兩者經常會放在一起介紹或者使用,今天就和大家聊聊...

鐵人賽 自我挑戰組 DAY 22

技術 Day22- 資料分析(5)電影樞紐

目標:1.不同年度的電影的最高分及平均分數2.不同類型電影,近幾年的最高及平均分數 電影名稱 年份 分數 0 A電影 2020 54 1...

鐵人賽 自我挑戰組 DAY 22

技術 Day 22|資料視覺化 - Matplotlib

  Pandas 是 Python 生態系中,適合用來做資料分析或機器學習的套件,上一篇文章介紹 Pandas 中對新手相當友善的繪圖函數 plot( ) ,讓...

鐵人賽 自我挑戰組 DAY 21

技術 Day21- 資料分析(4)樞紐分析

Pandas套件的Pivot Table樞紐分析表可以說是進行資料統計分析時非常好用的工具之一,可以快速解讀欄位資料之間的關係。 pd.pivot_tabl...

鐵人賽 自我挑戰組 DAY 21

技術 Day 21|Pandas 一招帶你快速製圖

  簡報時,我們常會聽到「用數字說話」這句話,面對主管、同事真的是講出每個數字就能讓聆聽者理解嗎?錯!大部分的人單看數字都容易眼花撩亂,想讓對方理解你的報告,圖...

鐵人賽 自我挑戰組 DAY 20

技術 Day20- 資料分析(3)年度精選

當我們在眾多資料中,想挑出各年度中的佼佼者時可使用此方法。 匯入資料 電影名稱 年份 分數 0 A電影 2019 54 1 B電影 2...

鐵人賽 自我挑戰組 DAY 20

技術 Day 20|在 VS Code 印出漂亮的 DataFrame

  VS Code 的使用者應該有發現 Pandas 的輸出結果有時並不是那麼好閱讀,對於一個有版面強迫症的我來說,曾經因為 DataFrame 歪掉的格式十分...

鐵人賽 自我挑戰組 DAY 19

技術 Day19- 資料分析(2)電影排名

若想要處理排名類型的資料集,可適用此做法來資料分析。 電影名稱 預算(千萬) 分數 0 A電影 165 54 1 B電影...

鐵人賽 自我挑戰組 DAY 19

技術 Day 19|用 Pandas 快速完成樞紐分析

  Excel 本身提供方便的樞紐分析,但你有想過用程式該如何撰寫嗎?今天就來分享一下 Pandas 中的樞紐分析:pivot_table( ) 一起透過交叉分...

鐵人賽 自我挑戰組 DAY 18

技術 Day18- 資料分析(1)問券調查

得到一份益生菌試吃一週後的問券,不同職業、身高、體重的人食用後的滿意度調查結果。 滿意度 職業 身高 體重 0 8 律師 165 54 1 5 教師 15...

鐵人賽 自我挑戰組 DAY 18

技術 Day 18|資料的分組和聚合

  在大型數據當中,有時我們會需要透過群組的方式概括整體資料,除了用以觀察之外,也能進一步深入處理,本文將分享如何使用資料的分組和聚合操作,內容包含: 資料分...

鐵人賽 自我挑戰組 DAY 17

技術 Day17- 資料探索(10)資料分組

當獲得龐大複雜的資料時,我們可將資料採用groupby()函式分組,方便以不同群組角度檢視資料。 先匯入資料 from pandas.core.groupb...