接下來繼續第2個模組的介紹。
講師說明為什麼要利用ML來取代經驗法則 (Heuristic Rules),如果是做小規模的專案還好,了不起寫個50個IF跟ELSE IF來判斷結果,但如果你有上千萬種可能性要處理,這時候繼續用IF跟ELSE IF只會搞死自己。
舉例還說,當不同地區的使用者利用Google搜尋同一個詞彙時,他們希望搜尋到的可能會是不同的結果,像台灣人搜尋Jay時,可能周杰倫會出現在比較前面的尋結果,但如果是美國人搜尋Jay的話,出現在比較前面搜尋結果的可能會是Jay-Z。其實Google搜尋在實作這個判斷功能時,有很長一段時間也是使用千千萬萬個IF跟IF ELSE的方式來達成,但在蒐集到足夠的訓練資料後,就可以改由ML來達到這個目的了。
同樣的概念也應用在咖啡廳推薦上,要推薦近一點的還是評價比較好的,又或者是可以在路上順便經過一間三明治店的?Google決定讓使用這自己決定,當然一開始不可避免的使用經驗法則,透過蒐集顧客的經驗來改善推薦結果,蛋等蒐集到一定量的資料後,就可以改用ML來推薦了。
要訓練出一個好用的ML模型的確是不容易,但有一個可以快速使用ML模型的方式,也就是使用預先訓練好的模型 (Pre-trained Model),而它的意思其實就是拿別人已經先訓練好,而且Input及Output也符合你需要的模型來使用,如此一來可以省下非常多的時間。而講師拿一間叫做AUCNET的國外中古車行作為例子。中古車的特性是要把車子的每個腳多都拍清楚,顧客從網頁上瀏覽時才能清楚知道車輛狀況,在過去,把圖片上傳至網頁時必須由人工自己判斷上傳圖片是屬於車的哪一部分,並且自己把文字KEY上去,但現在透過GCP的圖片辨識模組,使用者只須要把各種角度的照片全都丟到網頁上,模組就會自動辨識圖片是屬於車子的哪一個部分,也會自動把說明文字帶入。
ML還能有非常多的應用方式,從線上智能客服到Pizza訂餐系統,他們可能會用到部分相同的ML模型,但透過不同的組合,就可以達到不同的目的,同時也能縮短作業時效,並讓使用者有更佳的體驗,個人認為,有空的話可以多參考一下其他人是如何應用這些ML模型,說不定剛好靈光一閃,就創造出一個全新的服務囉!。
而要再次強調的是,為了讓ML模型得以準確應用,最重要的當然還是儘可能地收集數量又多品質又好的資料,這也是真的需要花很多心力投入去做的一部份,如果只有一咪咪資料大概只會訓練出一個四不像又誤判率極高的模型喔。
好了,今天先到這邊,模組2還有剩下一些些就等明天再補充囉~