延續上一篇文章,這篇文章要來談談ML的10 大陷阱剩下的五個!
***> 你的用戶可能不在乎你給他們的是ML,他們只關心它是否有新的酷功能或者它的建議真的很好。它需要大量用戶來你做了一個偉大的終端ML系統,它只是為了錯誤的事情而優化。因此,想像一下,如果谷歌搜索正在優化,
請假設用戶參與度取決於某人點擊搜索結果的頻率。這聽起來不錯。對?我們希望我們的用戶喜歡我們的產品,我們希望我們的用戶保持參與。但是如果我們優化他們點擊的頻率,那麼ML算法可能會學習提供不良內容,[來自課程內容]
將ML往"對"的方向優化才是重要的!當我們單只看將ML往最佳點閱Train時,可能ML給使用者的資訊就將會是不良的了
(以Google搜尋引擎為例)
你把它放在那裡,你打開它,它為用戶服務,但你不能說它有多好,你無法分辨是否有任何令人振奮的客戶參與或終身價值。[來自課程內容]
有些ML model並沒有實質改善公司的業務,而是在Train一個對業務沒有用處的model,
這很令人擔憂,於是我們在開發MLmodel之前一定得想好方向,並評估該ML model對業務的價值及貢獻。
這兩者有什麼區別呢,這裡不需要引用文章~
首先如果用了Pre Trained Model 那麼我們就可以省下一次Train需要花的時間及費用(廢話)
而GCP上的Pre Trained Model 已經發展的非常強大(前面的Vision API有示範玩玩~)
這在公司導入ML時不僅可以省下許多時間,更可以簡單的使用Pre Trained Model 得到結構化的資料,
用訓練屬於公司的ML model。
這是錯誤的,對這個變化莫測的世界,如果可以透過即時的反饋,而讓ML跟上人類的潮流做出變化,
那麼這個ML將不會被淘汰,而我們也無法確認第一次訓練的數據就可以概括這世上所有的變數,
在ML model做Predict的同時利用反饋來對ML model做Train也是很重要的。
**那就是,你想要設計自己的內部感知,即圖像或語音,或NLP分類,或者這是自然語言處理。
所以這些都是一種特殊的陷阱,因為它們似乎比實際上容易得多。
事實上,我們必須解決這些問題的所有算法都是經過幾十年的學術研究而得到很好的調整,
你應該幾乎總是採用現成的,已經製作的或已經定義的,而不是試圖做自己的研究,它是非常貴。
這邊我直接引用了課程原文!因為我也不好解釋XD,Google給的啟示是,用現成的吧,
但如果相信自己的ML程度也是可以自己試試XD(NLP沒有想像中的簡單)
-第9天,我是Dim,很抱歉第八篇的錯誤(快11點打完的~腦袋不靈了~),中秋愉快!