iT邦幫忙

2023 iThome 鐵人賽

0
AI & Data

嘗試在AI世界闖蕩系列 第 31

技術篇 Day 1-Iris_classification

  • 分享至 

  • xImage
  •  

原本預計在30天的賽程後期能做到技術篇的部分,但最後卻沒有,經過因期中考而暫停時間後,決定繼續上傳記錄自己的學習過程,希望自己能在AI領域越來越進步,同時自學能力也能更上一層樓!


技術篇大多使用Google Colab!


鳶尾花(Iris)品種的辨識

是使用分類演算法,進行Iris品種的辨識。

(依照鳶尾花的花萼sepal長度、寬度,花瓣petalt長度、寬度的特徵來辨識)

  1. 載入相關套件
    https://ithelp.ithome.com.tw/upload/images/20231027/20163102VNqWvCCk8J.png
  2. 載入Scikit-learn內建的鳶尾花資料集
    https://ithelp.ithome.com.tw/upload/images/20231027/201631023haOjv0tvU.png
  3. 查看鳶尾花資料集的說明
    https://ithelp.ithome.com.tw/upload/images/20231027/20163102wsWnY4Fiog.png
  4. 將屬性資料轉換為Pandas表格
    https://ithelp.ithome.com.tw/upload/images/20231027/20163102gzFq4iaBoJ.png
  5. 取得目標變數(Y):訓練資料中人工標註的每一筆的鳶尾花品種(0/1/2代表3個品種)
    https://ithelp.ithome.com.tw/upload/images/20231027/20163102UCdvk4uoU0.png
  6. 取得目標變數的類別名稱
    https://ithelp.ithome.com.tw/upload/images/20231027/20163102kgNNiULEdb.png
  7. 針對每一個變數進行分析,並對各變數檢查關聯性、各類別資料筆數進行統計。
    https://ithelp.ithome.com.tw/upload/images/20231027/20163102jVNpzw6yUh.png
    https://ithelp.ithome.com.tw/upload/images/20231027/20163102sP2Py9JWL9.png
    https://ithelp.ithome.com.tw/upload/images/20231027/20163102QuhEBf1LmI.png
    https://ithelp.ithome.com.tw/upload/images/20231027/20163102I8Hc0hBy8e.png
    https://ithelp.ithome.com.tw/upload/images/20231027/20163102TOuXCbc9En.png
    https://ithelp.ithome.com.tw/upload/images/20231027/201631029iIQLLnl0L.png
  8. 資料分割,將資料及切割為Training Data(提供模型訓練用)和Test Data(衡量模型效能)。
    https://ithelp.ithome.com.tw/upload/images/20231027/20163102lpOB6wLzgL.png
    https://ithelp.ithome.com.tw/upload/images/20231027/20163102tHr8HZDO8k.png
  9. 特徵縮放,將所有特徵規模一致化,避免數值單位不同使每個欄位對模型預測評估不一致。
    https://ithelp.ithome.com.tw/upload/images/20231027/20163102wwOQVOna4H.png
  10. 選擇演算法,使用LogisticRegression。
    https://ithelp.ithome.com.tw/upload/images/20231027/20163102Z9MEzuOSKN.png
  11. 模型訓練,訓練完成後儲存在clf變數中。
    https://ithelp.ithome.com.tw/upload/images/20231027/20163102PHGkk2tAkP.png
  12. Scoring,針對測試資料預測,然後將預測結果與真實答案做比對,統計出正確比例。
    https://ithelp.ithome.com.tw/upload/images/20231027/20163102R2FOOtWQqE.png
  13. 計算準確率。
    https://ithelp.ithome.com.tw/upload/images/20231027/20163102mBwtKtW65H.png
  14. 使用混淆矩陣觀察預測結果哪一類錯誤較多,針對錯誤多的收集更多資料、重新分類或調整演算法參數。
    https://ithelp.ithome.com.tw/upload/images/20231027/20163102PJXp8qkezu.png
  15. 使用混淆矩陣圖觀察。
    https://ithelp.ithome.com.tw/upload/images/20231027/20163102HzmBh3KM2R.png
    https://ithelp.ithome.com.tw/upload/images/20231027/20163102GGnVrlkodF.png
  16. 模型存檔。
  17. https://ithelp.ithome.com.tw/upload/images/20231027/20163102FRj03DMSpH.png

上一篇
Day 30 AI的核心應用:電腦的聽覺與視覺(視頻分析、行動辨識)
系列文
嘗試在AI世界闖蕩31
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言