iT邦幫忙

鐵人檔案

2025 iThome 鐵人賽
回列表
自我挑戰組

數據新手村:統計系畢業生 30 天打怪升級之旅 系列

這是一份寫給數據分析絕對新手的實戰全紀錄!

我是剛退伍的統計系畢業生,正踏上轉職數據科學的道路。本系列將以巴西 Olist 電商數據集為戰場,從零開始,完整記錄 30 天內學習 SQL 數據提取、Python (NumPy/Pandas) 資料處理與 Matplotlib 視覺化的歷程。

沒有高深理論,只有動手實作的汗水與筆記。跟著我,一步步打造你的第一個數據分析作品集!

參賽天數 24 天 | 共 24 篇文章 | 2 人訂閱 訂閱系列文 RSS系列文
DAY 11

Day 11 - 深入 NumPy 的資料類型 (dtype)

大家好,歡迎來到數據新手村的第十一天!昨天我們學會了各種「無中生有」的陣列創建方法,但可能已經注意到,在創建陣列時,常常伴隨著一個神秘的參數:dtype。 #...

2025-09-25 ‧ 由 瀚 Han 分享
DAY 12

Day 12 - NumPy 陣列的索引與切片神技

大家好,歡迎來到數據新手村的第十二天!昨天深入了解了陣列的靈魂——資料類型 dtype。今天要學習如何精準地操作陣列的「肉體」——也就是存取 (Access)、...

2025-09-26 ‧ 由 瀚 Han 分享
DAY 13

Day 13 - 告別 for 迴圈:NumPy 的向量化運算魔法

大家好!歡迎來到數據新手村的第十三天。在前幾天的學習中,已經掌握了 NumPy 陣列的創建和索引。今天要來學習 NumPy 之所以成為數據科學基石的真正原因——...

2025-09-27 ‧ 由 瀚 Han 分享
DAY 14

Day 14 - NumPy 實戰演練與總結:牛刀小試

大家好,歡迎來到數據新手村的第十四天,也是「NumPy 深度探索週」的最後一天!在過去的一週裡,我們學習了 NumPy 的核心 ndarray 物件、各種創建方...

2025-09-28 ‧ 由 瀚 Han 分享
DAY 15

Day 15 - Pandas 登場與 Series 詳解

大家好,歡迎來到數據新手村的第十五天!在經過一整週的 NumPy 內功修煉後,我們已經具備了高效處理數值陣列的能力。 但是,真實世界的數據往往不是純粹的數字,它...

2025-09-29 ‧ 由 瀚 Han 分享
DAY 16

Day 16 - Pandas DataFrame 的創建與資料存取

大家好,歡迎來到數據新手村的第十六天!昨天我們認識了 Pandas 的一維資料結構 Series,可以把它看作是帶有索引標籤的一維陣列。 今天,我們將迎來 Pa...

2025-09-30 ‧ 由 瀚 Han 分享
DAY 17

Day 17 - 用 Pandas 讀取 Olist CSV 檔案

大家好!歡迎來到數據新手村的第十七天。昨天學會了如何創建與操作 Pandas DataFrame,但真實世界的數據,很少是手動在程式碼裡建立的,它們通常存放在外...

2025-10-01 ‧ 由 瀚 Han 分享
DAY 18

Day 18 - Pandas 的資料篩選與條件過濾

大家好,歡迎來到數據新手村的第十八天!昨天我們成功將 Olist 訂單資料載入到 DataFrame 中,並對它進行了初步的「健康檢查」。 我們手上現在有近 1...

2025-10-02 ‧ 由 瀚 Han 分享
DAY 19

Day 19 - 資料清洗(一):如何優雅地處理缺失值 (Missing Values)

大家好,歡迎來到數據新手村的第十九天!在數據分析界有句名言:「一個數據分析師 80% 的時間,都花在清理數據上。」 從今天開始,我們將正式動手處理「髒數據」,而...

2025-10-03 ‧ 由 瀚 Han 分享
DAY 20

Day 20 - 資料清洗(二):型態決定一切,Pandas 資料類型轉換大法

大家好,歡迎來到數據新手村的第二十天!昨天我們學會了如何處理數據中的「缺失值」,讓我們的資料集不再有空洞。 但資料清洗的挑戰還沒結束。想像一下,如果一個紀錄價格...

2025-10-04 ‧ 由 瀚 Han 分享