iT邦幫忙

2024 iThome 鐵人賽

DAY 1
1
Python

30天Python資料分析挑戰:從基礎到視覺化系列 第 1

Day 01:目錄與學習目標介紹

  • 分享至 

  • xImage
  •  

歡迎來到為期30天的資料分析挑戰!在接下來的30天內,我們將一步步從零開始,學習如何使用Python進行資料分析。本課程專為沒有程式基礎的人設計,無論你是學生、專業人士,還是對資料科學感興趣的初學者,只要每天投入一點時間,你將能夠掌握資料分析的核心技能。

學習目標:

  • 掌握資料分析的基本概念:瞭解資料分析的步驟,包括資料清理、處理、視覺化及建模。
  • 熟悉Python開發環境:學習如何設定Python環境並使用Google Colab進行程式開發。
  • 資料處理與分析技能:學習如何清理和轉換資料,為後續分析奠定基礎。
  • 視覺化資料:學習如何使用圖表工具(如Matplotlib和Seaborn)視覺化資料,幫助解讀結果。
  • 應用機器學習模型:使用sklearn進行簡單的機器學習模型訓練、預測與評估。

每日學習內容預覽:

  • Day 01 - Day 05:了解資料分析的基本概念、安裝開發環境、初步使用sklearn進行資料讀取與輸出。
  • Day 06 - Day 11:學習如何檢視和處理資料,包括處理缺失值、異常值,以及進階的Numpy運算。
  • Day 12 - Day 17:進行資料篩選、切片與彙總分析,並初步了解資料視覺化。
  • Day 18 - Day 25:學習不同圖表類型的應用,實際使用Matplotlib和Seaborn進行資料視覺化。
  • Day 26 - Day 30:應用機器學習模型,並進行模型評估與測試。

具體挑戰:

每一天的教學內容都將以實際操作為主,提供範例程式碼和步驟說明。學習者將使用Iris資料集進行練習,逐步熟悉如何對資料進行處理、視覺化以及分析。

學習建議:

  • 每天花1小時學習:每節課的設計讓你能在大約1小時內完成一個學習任務。每天學習一點點,逐步累積知識。
  • 動手實作:實作是學習程式的關鍵。無論遇到什麼困難,嘗試理解錯誤訊息並尋找解決方案。
  • 持之以恆:30天的挑戰將從簡單到複雜,持續的學習和實踐將幫助你掌握這項技能。

你將學到:

  • 如何讀取資料並進行初步分析
  • 如何使用Pandas和Numpy處理資料
  • 如何使用Matplotlib和Seaborn視覺化數據
  • 如何使用機器學習模型進行預測與分類

這是一個實踐導向的學習過程,每一天都將帶你更接近資料分析的專業技能。準備好開始這段學習之旅了嗎?


以下是完整目錄:

Day 01: 目錄與學習目標介紹

介紹本次30天挑戰的學習目標與課程大綱。

Day 02: 什麼是資料分析?

講解資料分析的基本概念和其應用範疇。

Day 03: 安裝與設定Python環境

介紹如何安裝並設定Python環境,以及使用Google Colab進行開發。

Day 04: sklearn套件介紹

介紹sklearn套件,並示範如何使用內建資料集進行資料處理。

Day 05: 講解Iris資料並輸出成CSV檔案

深入分析Iris資料集並將其儲存為CSV檔案。

Day 06: Google Colab如何讀取CSV檔案

教學如何在Google Colab中讀取CSV檔案並進行資料檢視。

Day 07: 使用Pandas快速檢視資料集

使用Pandas檢視資料集的前後幾筆資料、隨機抽樣、統計摘要等方法。

Day 08: 資料處理 - 處理資料中的缺失值 (NAN)

教學如何處理資料中的缺失值,使用dropna()或fillna()進行填補或刪除。

Day 09: 資料清理 - 處理資料中的異常值與重複值

介紹如何檢查並處理資料中的異常值與重複值,確保資料質量。

Day 10: 基本的Numpy運算介紹

講解Numpy的基本運算,包括陣列操作與統計函數。

Day 11: Numpy 運用在 Iris 資料集上的實作

將Numpy運用到Iris資料集中,進行進階資料處理與分析。

Day 12: 資料篩選與資料切片

教學如何根據條件篩選資料,並使用切片操作提取需要的資料子集。

Day 13: 資料型態轉換與處理

介紹如何轉換資料的數據型態,例如將類別變數轉換為數值變數。

Day 14: 資料的分組與彙總分析

講解如何根據不同特徵對資料進行分組,並計算統計摘要(如平均值、總和)。

Day 15: 簡單的 Markdown 語法教學介

Markdown 是一種輕量級的標記語言,可以輕鬆地進行文字格式化,適合用於網頁、筆記和文件撰寫。

Day 16: 資料合併與連接

教學如何將多個資料框進行合併與連接,以便綜合處理多個資料集。

Day 17: 簡單的資料視覺化 (介紹Matplotlib與Seaborn)

引入Matplotlib和Seaborn,並使用它們進行簡單的資料視覺化。

Day 18: 柱狀圖 (Bar Plot) 的應用與實作

講解柱狀圖的應用情境,並實際使用Matplotlib和Seaborn繪製。

Day 19: 散點圖 (Scatter Plot) 的應用與實作

講解散點圖如何展示兩個變數之間的關係,並進行實作。

Day 20: 直方圖 (Histogram) 的應用與實作

介紹直方圖的應用場景,並使用Matplotlib和Seaborn進行實作。

Day 21: 面積圖 (Area Plot) 的應用與實作

講解如何使用面積圖展示累積變化的趨勢,並進行實作。

Day 22: 資料排序與排名

教學如何對資料進行排序並建立排名表,適合進行比較分析。

Day 23: 餅圖 (Pie Chart) 的應用與實作

講解餅圖的應用情境,並進行實作展示分類的比例分佈。

Day 24: 箱型圖 (Box Plot) 的應用與實作

介紹箱型圖用於顯示資料分佈和檢測異常值的功能,並進行實作。

Day 25: 熱圖 (Heatmap) 的應用與實作

講解熱圖如何用於顯示變數之間的相關性,並進行實作。

Day 26: 資料標準化與正規化

介紹資料標準化與正規化的概念,並講解如何將資料進行標準化處理。

Day 27: 使用Pandas進行進階數據操作

教學如何使用Pandas進行進階的數據處理操作,如資料透視表、進階篩選等。

Day 28: 使用Sklearn進行簡單的線性回歸

介紹如何使用Sklearn來建立線性回歸模型,並用Iris資料集進行實作。

Day 29: 使用Sklearn進行分類分析

講解如何使用Sklearn進行分類任務,例如使用Iris資料集進行花卉分類。

Day 30: 模型評估與準確度測試

教學如何使用交叉驗證和其他方法來評估模型的準確性與表現。


接下來的 Day 02,我們將介紹資料分析的基本概念,


下一篇
Day 02: 什麼是資料分析?
系列文
30天Python資料分析挑戰:從基礎到視覺化30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言