iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 8
1
Google Developers Machine Learning

站在Google巨人的肩膀上玩機器學習系列 第 8

[Day 8 ] How Google does Machine Learning - Module 3-2

  • 分享至 

  • xImage
  •  

今天要介紹的是,根據Google經驗,建議我們在進行ML專案時應該要避免的以下10個陷阱:

  1. ML只需要剛好的軟體作為基礎設施:很多時候,一個ML模型會需要足夠的軟體作為其基礎設施,以確保整個過程夠彈性及順暢,但有時候會不小心在撰寫軟體時,讓整個過程不小心變得過於複雜,因此會建議不要把軟體部分搞得太複雜,否則可能會影響到ML模型本身。
  2. 沒有蒐集到足夠的資料:沒有資料一切就是空談,在之前的介紹中也已經強調過多次。
  3. 以為所蒐集的資料已經可以拿來訓練:假設你有一台機器本來就會定期產出資料,但如果從來都沒人會去定期檢視產出的資料品質,那這份資料可能是無法使用的。
  4. 要將人考量入專案中:因為ML最終是要應用到組織內的,所以要有人來處理資料品質或是模型無法完美處理的部分。
  5. 開發產品時過度專注於ML部分:對於使用者來說,ML最重要的是最終產出,以及功能聽起來是否酷炫,因此過度強調ML演算法本身對於專案並無助益。
  6. 利用ML但卻最佳化錯誤的目標:以Google搜尋為例,如果太過於專注想讓使用者再次回來使用,因此使用點擊率作為演算法計算的依據,可能會導致最後搜尋出來的結果都是一些引誘人點擊但沒什麼實際內容的結果,因此必須注意,最佳化不需要做到完美,而且需要隨時注意是否有不當誘因 (Perverse Incentives) 存在。
  7. ML是否可以改善實際生活中的問題:如果ML無法解決實際上需要被解決的問題,那你的老闆應該也無法接受你花時間在做一些沒有用的事情。
  8. 要使用預先訓練好的ML模型,或是要建立一個自己的:如果已經有現成也適用的ML模型可用,也可以不用拘泥於一定要自己建造一個自己的模型,這會花掉非常多的時間,而且訓練出來的模型還不一定比較好。
  9. ML演算法只被訓練過1次:如果要得到一個好的而且可以實際應用的ML模型,基本上都是要訓練非常多次才有辦法達成。
  10. 想要自己設計出獨特的感知或自然語言處理 (Natural Language Processing, NLP) ML模型:這種類型ML模型的訓練是需要由學術或研究單位以十年為單位為計算,花許多心力去執行的,而且需要高度的調整,因此要自己做到幾乎是不大可能的事情。

https://ithelp.ithome.com.tw/upload/images/20190924/20107304AiwMIYBHO6.png

這邊介紹了10個常遇到的陷阱,但如果真的不小心踩進陷阱也不用擔心,這些都會成為之後專案的經驗!


上一篇
[Day 7] How Google does Machine Learning - Module 3-1
下一篇
[Day 9] How Google does Machine Learning - Module 3-3
系列文
站在Google巨人的肩膀上玩機器學習30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言