iT邦幫忙

鐵人檔案

2025 iThome 鐵人賽
回列表
自我挑戰組

數據新手村:統計系畢業生 30 天打怪升級之旅 系列

這是一份寫給數據分析絕對新手的實戰全紀錄!

我是剛退伍的統計系畢業生,正踏上轉職數據科學的道路。本系列將以巴西 Olist 電商數據集為戰場,從零開始,完整記錄 30 天內學習 SQL 數據提取、Python (NumPy/Pandas) 資料處理與 Matplotlib 視覺化的歷程。

沒有高深理論,只有動手實作的汗水與筆記。跟著我,一步步打造你的第一個數據分析作品集!

鐵人鍊成 | 共 30 篇文章 | 1 人訂閱 訂閱系列文 RSS系列文
DAY 21

Day 21 - 在 Pandas 中新增與刪除欄位

大家好,歡迎來到數據新手村的第二十一天!在過去幾天,我們學會了載入資料、篩選資料、處理缺失值和轉換資料類型。我們的數據集已經變得越來越乾淨。 但數據分析的魅力,...

2025-10-05 ‧ 由 瀚 Han 分享
DAY 22

Day 22 - Pandas 的 Group By 分組聚合

大家好,歡迎來到數據新手村的第二十二天!在過去的幾天裡,我們學會了如何讀取、篩選、清理我們的 Olist 數據集。現在,我們的 DataFrame 已經準備就緒...

2025-10-06 ‧ 由 瀚 Han 分享
DAY 23

Day 23 - Pandas 的 Merge 與 Join 多表合併

大家好,歡迎來到數據新手村的第二十三天!昨天我們掌握了 groupby 這個強大的聚合分析工具,學會了如何從單一表格中萃取高層次的洞見。 但真實世界的數據,很少...

2025-10-07 ‧ 由 瀚 Han 分享
DAY 24

Day 24 - Pandas 的時間序列資料處理

大家好,歡迎來到數據新手村的第二十四天!到目前為止,我們已經學會了如何載入、清理、篩選並合併我們的 Olist 數據集。我們的 DataFrame 已經越來越有...

2025-10-08 ‧ 由 瀚 Han 分享
DAY 25

Day 25 - Matplotlib 視覺化初登場

大家好,歡迎來到數據新手村的第二十五天!在過去的一週裡,我們深入 Pandas 的世界,學會了載入、清理、篩選、合併,甚至進行了時間序列的分析。我們已經能透過...

2025-10-09 ‧ 由 瀚 Han 分享
DAY 26

Day 26 - 探索數據分佈:Matplotlib 的直方圖與箱線圖

大家好,歡迎來到數據新手村的第二十六天!昨天我們畫出了第一張折線圖和長條圖,成功將數據的趨勢與類別比較,直觀地呈現了出來。 但數據分析不僅僅是看平均值或總和。如...

2025-10-10 ‧ 由 瀚 Han 分享
DAY 27

Day 27 - Matplotlib 散點圖與 Seaborn 初探

大家好,歡迎來到數據新手村的第二十七天!昨天,我們學會了使用直方圖和箱線圖,來分析單一變數(例如運送天數、訂單金額)的內部樣貌。 但數據分析的真正樂趣,在於挖掘...

2025-10-11 ‧ 由 瀚 Han 分享
DAY 28

Day 28 - 專案實戰(一):Olist 整體銷售趨勢視覺化分析

大家好,歡迎來到數據新手村的第二十八天!在鐵人賽的最後幾天,將進入「專案實戰」階段。 今天,不再學習單一的函式或語法,而是要將過去幾週學到的所有技能——Pand...

2025-10-12 ‧ 由 瀚 Han 分享
DAY 29

Day 29 - 將 Pandas 成果存入 MySQL 並用 SQL 查詢

大家好,歡迎來到數據新手村的第二十九天!昨天,我們完成了第一個端到端的分析專案,成功計算出了 Olist 平台的「月銷售額」並用圖表呈現。 但這個 monthl...

2025-10-13 ‧ 由 瀚 Han 分享
DAY 30

Day 30 - 旅程的終點與起點:30 天挑戰總結與未來展望

大家好,歡迎來到數據新手村的第三十天,也是我們這趟旅程的最後一站。 三十天,像一場精彩的冒險,終於來到了終點。首先,向每一位在這 30 天裡,曾點開、閱讀、留言...

2025-10-14 ‧ 由 瀚 Han 分享