這是一份寫給數據分析絕對新手的實戰全紀錄!
我是剛退伍的統計系畢業生,正踏上轉職數據科學的道路。本系列將以巴西 Olist 電商數據集為戰場,從零開始,完整記錄 30 天內學習 SQL 數據提取、Python (NumPy/Pandas) 資料處理與 Matplotlib 視覺化的歷程。
沒有高深理論,只有動手實作的汗水與筆記。跟著我,一步步打造你的第一個數據分析作品集!
大家好,歡迎來到數據新手村的第十一天!昨天我們學會了各種「無中生有」的陣列創建方法,但可能已經注意到,在創建陣列時,常常伴隨著一個神秘的參數:dtype。 #...
大家好,歡迎來到數據新手村的第十二天!昨天深入了解了陣列的靈魂——資料類型 dtype。今天要學習如何精準地操作陣列的「肉體」——也就是存取 (Access)、...
大家好!歡迎來到數據新手村的第十三天。在前幾天的學習中,已經掌握了 NumPy 陣列的創建和索引。今天要來學習 NumPy 之所以成為數據科學基石的真正原因——...
大家好,歡迎來到數據新手村的第十四天,也是「NumPy 深度探索週」的最後一天!在過去的一週裡,我們學習了 NumPy 的核心 ndarray 物件、各種創建方...
大家好,歡迎來到數據新手村的第十五天!在經過一整週的 NumPy 內功修煉後,我們已經具備了高效處理數值陣列的能力。 但是,真實世界的數據往往不是純粹的數字,它...
大家好,歡迎來到數據新手村的第十六天!昨天我們認識了 Pandas 的一維資料結構 Series,可以把它看作是帶有索引標籤的一維陣列。 今天,我們將迎來 Pa...
大家好!歡迎來到數據新手村的第十七天。昨天學會了如何創建與操作 Pandas DataFrame,但真實世界的數據,很少是手動在程式碼裡建立的,它們通常存放在外...
大家好,歡迎來到數據新手村的第十八天!昨天我們成功將 Olist 訂單資料載入到 DataFrame 中,並對它進行了初步的「健康檢查」。 我們手上現在有近 1...
大家好,歡迎來到數據新手村的第十九天!在數據分析界有句名言:「一個數據分析師 80% 的時間,都花在清理數據上。」 從今天開始,我們將正式動手處理「髒數據」,而...
大家好,歡迎來到數據新手村的第二十天!昨天我們學會了如何處理數據中的「缺失值」,讓我們的資料集不再有空洞。 但資料清洗的挑戰還沒結束。想像一下,如果一個紀錄價格...