[Day08]Machine Learning 10 大陷阱[上]

第 11 屆 iThome 鐵人賽

DAY 8

Google Developers Machine Learning

Google'sMachineLearning-挑戰機器智慧極限系列第 8 篇

11th鐵人賽 mlstudyjam machine learning

nightlan1015297

2019-09-11 23:23:13

1469 瀏覽

分享至

10PITFALL

ML 十大陷阱

* 1.ML需要大量的軟體基礎

什麼難道ML不需要太強的軟體基礎嗎？Google解釋，再導入ML到自家公司時，選擇預有的框架會比較好，
許多人認為開發一個屬於公司的ML會比用框架還好，又或者是想要創建一個超越演算法的MLmodel，
但這意味著在開發這個ML時必須在演算法上費一大番功夫
在訓練方面增加額外的複雜性，所有這些都會變得更加複雜。[來自課程內容]

* 2.沒有收集數據QAQ

想做ML，但還沒有收集數據？Google說你必須完全停止！沒有數據，沒有ML，就是這麼簡單，
如果沒有收集到很好的數據，或者無法獲得優質的數據，那麼談論做出很棒的ML是沒有用的。

以上是講師在Google的個人經驗

* 3.認為數據已經可以用了

如果一個產品我們已開發多年，我們手上一定有數據，只是這些數據真的可以拿來用嗎？
我們確實擁有這些數據，已經紀錄了多年，寫在某個系統上，而另一個部門的某個人控制著，但是我們沒有看過它，這些數據還沒有準備好使用。[來自課程內容]

是的，這些數據還得經過處理，才能餵給ML model！順帶一提，輕視數據整理這步驟會有代價的~

在我與之交談過的所有客戶中，我從來沒有見過
一個過高估計收集乾淨數據所需的工作量的客戶。
沒有人說過這比我預想的要容易，因為這裡會有很多痛苦和摩擦。[來自課程內容]

以上是講師在Google協助其他企業開發ML的經驗

* 4.把人放在循環中

把人放在循環中指的是什麼呢！我覺得直接引用講師的話比較好懂XD，我當初看也不太清楚把人放在循環在講啥，
後來聽他一講就開竅了！

當我們進入這些開始在我們的組織中執行核心任務或核心業務流程的ML系統時，
它們變得非常重要。適當地，組織會對這些系統產生風險厭惡，因為他們是組織的養家者，
然後變得非常重要，以減輕這種風險。我們做到這一點的無數方法之一是我們將人類留在循環中[來自課程內容]

有Get到嗎，簡單的理解的話，就是ML和Human相輔相成，Machine Learning不可能完全取代人類，
而利用MachineL Learning 完全取代人類的工作也會造成員工反感(誰會做一個東西害自己失業~)。

* 5.把視線聚集在優化ML

***你的用戶可能不在乎你給他們的是ML，他們只關心它是否有新的酷功能或者它的建議真的很好。它需要大量用戶來你做了一個偉大的終端ML系統，它只是為了錯誤的事情而優化。因此，想像一下，如果谷歌搜索正在優化，
請假設用戶參與度取決於某人點擊搜索結果的頻率。這聽起來不錯。對？我們希望我們的用戶喜歡我們的產品，我們希望我們的用戶保持參與。但是如果我們優化他們點擊的頻率，那麼ML算法可能會學習提供不良內容，[來自課程內容]

將ML往"對"的方向優化才是重要的！當我們單只看將ML往最佳點閱Train時，可能ML給使用者的資訊就將會是不良的了
(以Google搜尋引擎為例)

[抱歉第五點內容打成第六點了！我在日後會修改]

這篇引用較多(因為它整個課程都在舉例QQ)