iT邦幫忙

2021 iThome 鐵人賽

DAY 20
0
AI & Data

後端工程師的ML入門理解與Vertex AI系列 第 20

介紹Vertex(3) | ML#Day20

Mail 通知

訓練好模型之後,Google會主動發mail通知。


訓練失敗

其實有可能訓練一半就失敗,目前遇過三種錯誤訊息分享給大家

  1. 資料筆數最少要1000筆以上。
  2. 權重欄位不重複值不能超過10000筆以上。
  3. 欄位名稱無法解析(每個欄位開頭要用英文字母,用『-』好像會有問題,有『?』好像也有問題)。

這類的錯誤雖然我們直覺餵入進去,應該是馬上可以知道的事情,但實際上可能跑了好幾分鐘,google才回報錯誤,而介面上似乎也沒看到有說明資料格式有什麼需求,可能是Google推出這個新功能比較小小可惜的部分,目前只能trial and error的方式,用經驗做學習。



訓練列表

點選『訓練』,會列出目前各式狀態的模型,失敗、執行中、成功。


訓練中的狀態

點進訓練中的模型,可以看到訓練的狀況,如果有明顯的向下的斜線,恭喜,Vertex找到一個讓模型變得更好的處理方式。

不過看不到任何點,或只有一個點,可以要有心理準備結果不會太好,因為Vertex找不到一個適合的訓練方式。


訓練完成的模樣

這是其中一次我們訓練出來的模型,上面Vertex會告訴你各項訓練的結果,?的部分有基本的解釋每項數值的意義,基本上最關心的是R^2,普遍來說至少需要有0.6以上模型才派得上用場。

下方的直方圖,告訴我們每個欄位參數的重要性,越底下的參數越無關緊要,可以考慮下次排除不使用。


匯出

右上角有個匯出按鈕,它會請你先放到Google Cloud Storage,過幾分鐘之後便能用它提供的gsutil指令,下載到本機(本機請先安裝gcloud討件),在本機打開會是一個內含很多檔案的資料夾,上面說明這是個tensorflow套件。

若不想麻煩自己部署模型應用,也可以選擇Vertex提供的部署方式,當然這些都是需要另外收費。

下一篇我們從部署的介紹開始。


上一篇
介紹Vertex(2) | ML#Day19
下一篇
介紹Vertex(4) | ML#Day21
系列文
後端工程師的ML入門理解與Vertex AI30

尚未有邦友留言

立即登入留言