前面講到我們可以利用機器學習創造出算命水晶球一樣神奇的預測模型,但它需要大量的數據用來訓練才行。
所以在建立強大的人工智慧之前,還必須先透過工人智慧產生出數量龐大的"題目"與"解答",再用來訓練模型。
光想像就知道,準備數據很花錢。那 G 社是怎麼做的呢?
有時候你要搶限量商品,店商網站為了避免你是機器人(自動化工具),利用G社提供的工具來進行驗證。
你輸入答案並提交的時候,就已經默默地無償幫助 G 社訓練模型了!
舉例來說這個題目,你在幫 G 社進行圖片分類的工作。
不過因為 G 社提供的課程實作內容已經準備好數據讓你體驗機器學習的強大了。
應該會讓很多初學者進入粉紅泡泡而不知道前置準備有多可怕。
所以要記得,要玩機器學習,先評估手上有的數據品質適合用來訓練模型。
如果不適合,就回頭先準備好數據蒐集的 pipeline 吧!
你輸入答案並提交的時候,就已經默默地無償幫助 G 社訓練模型了!
為什麼呢?
G社不是已經知道答案,才讓我們挑選的嗎?
它已經知道答案了,那我們又幫了它什麼呢?