如果 ML 像是一個引擎,那麼能讓它運作的資料就像是它的燃料!
為什麼會這樣說呢?在課程裡,講者提到機器學習所訓練出來的模型,其預測如何運作,很難用我們人腦來理解。
在我的理解中,我們推定一個因(手頭上的資訊)果(預測未來的結果)關係,都非常的簡單。而且也很難量化各個因素對於結果的影響占多少比例。
比如說,我們推論為什麼人決定會買蘋果最新的手機,可能是10~20%的經濟因素(買得起),30~40%的品牌潮流(買了代表潮)等等。所以看一個路人,從他的穿搭,衣服多貴,手上拿著星巴克,覺得他比較有機會買蘋果手機。
但對機器學習來說就不同了,它可以從大量的資料中,每筆資料多維度的紀錄(一筆資料有各種變數),訓練出來比我們人腦概括出來的推論還要準確的預測模型。
所以才說資料就是 ML 的燃料!