iT邦幫忙

2021 iThome 鐵人賽

DAY 27
0
AI & Data

AI平台初學者工作坊: 從training、tracking到serving系列 第 27

口罩臉孔資料集的訓練(Training)

上一篇我們已經為資料集做好資料前處理、資料擴增與資料集版本建立, 接下來我們要開始執行training.

請在eden_mask資料集中點選Versions頁籤, 然後點擊3.0.0版號的training圖示, 如下圖紅框所示
https://ithelp.ithome.com.tw/upload/images/20211010/20140792fCUpaMA1Ir.png

這時只要輸入Model Name就好, 而Select file欄位會自動帶入.
需要說明一下的是訓練的方法與資料切分的比例這二個欄位, 因為兩個選項會影響訓練的品質.

  • 訓練的方法(Method fo Training):初次使用時建議先選用預設的 [小尺寸/低精準度] 方法,高精準度的模型通常需要數小時到數天的工作時間,而快速得到的低精準度模型也許已經足夠勝任辨識的工作。
  • 資料切分的比例(Split Images):模型訓練是一個監督式的過程,系統會將資料分為訓練集 (考古題) 與測試集 (模擬考卷),這個切分的比例可以按照你個人的喜好,然而同樣切分比例得到的訓練集也不會每次都完全相同,這是一個隨機抽樣的過程。理想的切分比例不用保留過多的測試集,10%~20% 應該是一個不錯的比例,但若你的資料集版本內有高達數十萬筆的資料,這時候你可以試著將測試集的比例再調低一點。

訓練方法我們選擇Faster detction & Small size, 就先以小尺寸進行說明 .而資料切分保留原本的設定, 也就是8:2.
接著點擊Create
https://ithelp.ithome.com.tw/upload/images/20211010/20140792Bsd8lnAVm1.png

Nilvana根據資料集版本的統計量,預先為你設定了理想的最大訓練迭代次數,不需要調整太多的參數就可以完成訓練設定。然而,若你發現訓練過程中的曲線已經收斂到理想情況,你可以隨時中斷訓練工作,不用等到所有迭代都執行完畢。
https://ithelp.ithome.com.tw/upload/images/20211010/20140792qA0XMQebGK.png

當完成訓練之後, 可以在第三個功能(Models)中看到已產生的model, 如下圖.
我們再點mask_model進去看看.
https://ithelp.ithome.com.tw/upload/images/20211010/20140792rMmMMflgDj.png

下圖顯示的是訓練出來的model內容
https://ithelp.ithome.com.tw/upload/images/20211010/20140792xlxXsEEbZY.png

我們先來評估/測試一下我們訓練出來的模型準不準, 請點擊下圖的Model Evaluation頁籤
https://ithelp.ithome.com.tw/upload/images/20211010/20140792GRrdEc4BBf.png

Model Evaluation頁籤後, 左側顯示訓練的記錄, 右側你可以上傳一張圖片試試看訓練出來的model準不準. 現在就讓我們來試試這個功能, 請點擊Select Image
https://ithelp.ithome.com.tw/upload/images/20211010/20140792TIsMQCclzw.png

上傳一張圖片後,就可以確認辨識結果,如下圖中系統辨識有戴口罩的機率是97.8%
https://ithelp.ithome.com.tw/upload/images/20211010/20140792QgBs6kwtwF.png

監督式學習的模型品質跟高品質的資料集有很大的關係,如果你覺得效果不盡理想,可以先試著增加有意義的訓練資料,再實驗使用不同的訓練方法與切分比例。

到此我們已經使用 Nilvana 的 Vision Studio 完成口罩辨識模型的訓練流程,選定資料集版本後,在 UI 上就能選擇訓練方式及圖片切分比例,對於模型訓練的任務來說更加輕鬆上手


上一篇
口罩臉孔資料集的標註、資料前處理與資料擴增
下一篇
建立Endpoint執行二次開發
系列文
AI平台初學者工作坊: 從training、tracking到serving30

尚未有邦友留言

立即登入留言