資料的最終目的就是替代人力。
(https://qz.com/217199/softbanks-humanoid-robot-will-be-great-for-tending-to-japans-elderly/)
不要以為透過資料達到自動化是這幾年 AI、深度學習火紅之後才發生的的事情,其實早在更早之前,人類就懂得搜集資料來將工作自動化了。
最早的自動化來自工業時代。
(工業時代蒸汽機)
蒸汽機發明後,機器開始可以取代人力。這些機器當然不會天生自己就會動,一定是透過反覆的觀察、實驗、紀錄、調整,來將機器改成能夠取代人力的樣子。
而這個「觀察、實驗、紀錄、調整」的過程,都需要資料才有辦法做到,也是現在不管是資料分析還是機器學習的核心精神。
上圖是基本機器學習的演算法的虛擬碼,最關鍵的地方就是第 5、6、7 行,表示一次迭代(將更新的變數取代前一次的變數)的完成。而一般的演算法少說都會迭代個幾百次,如果資料量更大、參數更多,就需要迭代更多次才能將結果收斂(收斂表示更新後的變數已經沒有太大的變動)。因此雖然精神一樣,但是迭代的速度和頻率就差很多了,也讓大家對於軟體的自動化有更多想像。以下我們將介紹幾個比較成熟、也比較熱門運用資料來做自動決策的範例。
從廣告推薦(Google)、商品推薦(Amazon)到影片推薦(Netflix),可以看到推薦做得好就能做成業界第一大佬(無誤)。推薦模型是很早就發展起來、也非常好應用的自動決策系統。
推薦系統相關的文章相當推薦同樣是鐵人的mikechenx,的系列文章-一服見效的 AI 應用,我就不在這邊獻醜了。
說到 AI 怎麼能不說到圍棋。AlphaGO當年一戰成名,讓人看到 AI 的潛力。在贏過人類棋王之後,後記的 AlphaGO 甚至靠著對打就能超越原本的訓練模型,達到了強化式學習追求的頂峰-不靠任何外在資料,僅靠著懲罰和學習就能學會技能。
(棋靈王)
因為遊戲環境內的規則單純、加減分機制也容易計算,在學會圍棋之後,大家也開始嘗試讓 AI 學習其他遊戲,像是:
圖像辨識算是深度學習中發展最快的一塊。當初有個公開比賽叫做ImageNet,2012 年 AlexNet 的錯誤率已經降低到 15% 左右,到了 2015 年微軟的 ILSVRC 已經將錯誤率降低到 5% 左右,表示視覺辨識的技術已經成熟到超過人類的正確率。
當圖片辨識率提高到這種程度,接下來的發展也就可以預期:
應用也已經非常普遍,像是 Iphone 的人臉辨識解鎖、特斯拉的電動車、電動卡車等等,已經進入我們的日常生活中。
早期因為算力有限的關係,所以模型複雜度和資料量受到嚴格的限制。但隨著 GPU 算力越來越強,模型堆疊的越來越複雜後,模型的瓶頸從模型又回到 Data 上。
主要原因還是在於目前這些自動決策的 AI 都相當依賴人工的標籤(Label),也就是監督式的學習,需要大量的標籤資料來訓練模型(例如若水科技【AI 時代】AI 並非取代人力 若水身障數據標註師找到新活水)。但越難的領域,能夠拿到的標籤資料也就越少(例如醫學影像資料),這就讓難題重新回到資料上。
另外在由於 AI 模型嚴重受到資料的影響,因此也讓一些偏見、或歧視資料一併進入了 AI 中。(三招助你消除人工智慧的傲慢與偏見!)
這些都是未來在推行自動化決策的路上需要留意的議題。
https://www.newton.com.tw/wiki/%E5%9C%96%E5%83%8F%E8%AD%98%E5%88%A5%E6%8A%80%E8%A1%93
https://ithelp.ithome.com.tw/users/20001976/ironman/2646?page=1