作為此課程系列的開端,此課程主要是會以一個較為High-level的角度,和大家介紹何謂機器學習,包含其背後概念與當中事如何運作的,以及Google所提倡的AI First到底意指什麼,以作為後續較為進階且實作導向課程的入門。
課程中首先提到環繞在我們生活當中的許多Google相關服務其實都有機器學習應用的元素在裡頭,像是Google Photos裏頭的照片分類功能、Youtube平台上的影片推薦、Adwords上精準化的廣告投放及自動駕駛車當中相當重要的行人偵測,機器學習可說大大地影響了Google如何進行其各種業務。
而作為支撐這些商業應用的背後的工具,由Google開源的TensorFlow深度學習框架是其中不可或缺的角色,課程中提到,截至2016年結束,已經有超過4000個(這規模也太驚人了!)由TensorFlow建立的機器學習模型應用於生產環境。
接下來課程中提到了一個我覺得大家容易忽略,但是卻是不可忽視的概念,其實在一個機器學習的生命週期中,雖然包含了資料收集、資料前處理、特徵工程、模型訓練、模型評估、模型迭代優化與部署至生產環境等多個階段,但是往往在機器學習的工作上我們會過度關注模型訓練(Modeling Training)的環節,以致忽略了其實對於機器學習來說,更重要的是完成模型部署(Modeling Serving)來讓需求者們進行使用,才能將從資料中學習到智慧的機器學習模型真正落地並發揮價值。而在整個機器學習的工作流程中,Google Cloud Platform也針對各環節提供了相應的工具可以使用(圖1),大大地為我們簡化應用機器學習的負擔。
圖1
Source: Coursera - How Google does Machine Learning