iT邦幫忙

第 12 屆 iThome 鐵人賽

0
自我挑戰組

AI 高中生的自我學習系列 第 8

Day 8 - 目前(傳統)的機器學習三步驟(3)-訓練

  • 分享至 

  • xImage
  •  

第三步 Training : 訓練並驗證,找出最佳結果

挑選[學習演算法]

  • 什麼是演算法(Algorithm) (根據 Wiki 的定義)
    演算法(algorithm),在數學(算學)和電腦科學之中,為任何一系列良定義的具體計算步驟,常用於計算、數據處理和自動推理。作為一個有效方法,演算法被用於計算函式,它包含了一系列定義清晰的指令,並可於有限的時間及空間內清楚的表述出來。
    演算法中的指令描述的是一個計算,當其執行時能從一個初始狀態和初始輸入(可能爲空)開始,經過一系列有限而清晰定義的狀態最終產生輸出並停止於一個終態。一個狀態到另一個狀態的轉移不一定是確定的。包括隨機化演算法在內的一些演算法,都包含了一些隨機輸入。

Example 1 : 應對燈泡不亮的演算法
https://ithelp.ithome.com.tw/upload/images/20201205/20130601ian97nbwIr.png

Example 2 : I-Nearest Neighbor Classifier (以最鄰近單位決定其分類)
https://ithelp.ithome.com.tw/upload/images/20201205/201306012v41w0ADqS.png

Example 3 : K-Nearest Neighbor (kNN) Classifier (以下例子是以最近3個鄰近單位決定其分類, 至於多少鄰近單位由參數調整(k 值),這是模型評估之一)
https://ithelp.ithome.com.tw/upload/images/20201205/20130601iESPD3kcVh.png

學習演算法(模型)評估 Model Evaluation

  • 如何量測好壞 Performance Measures
    • How predictive is the model we learned?
    • Natural performance measure for classifification problems: Accuracy
    • Success: instance’s class is predicted correctly
    • Error: instance’s class is predicted incorrectly
    • Accuracy: proportion of successes made over the whole set of instances

收集的數據可以拿來做訓練及測試使用

  • 分二部分: Training/Testing Data Set
    https://ithelp.ithome.com.tw/upload/images/20201205/20130601detPWGbUaj.png
  • Ensures that each class is represented with approximately equal proportions in both subsets
  • (確保數據劃分時,不同類別的比例大致相同)
    https://ithelp.ithome.com.tw/upload/images/20201205/201306019EN2AcCRvF.png
註:本文是搜尋數個網站及各種不同來源之結果,著重在學習,有些內容已難辦別出處,我會儘可能列入出處,若有疏忽或出處不可考,請聯絡我, 我會列入, 尚請見諒。

上一篇
Day 7 - 目前(傳統)的機器學習三步驟(2)-關鍵特徵
下一篇
Day 9 - 目前(傳統)的機器學習三步驟(4)-訓練之測試
系列文
AI 高中生的自我學習30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言