兩年前我也曾經參加過 iThome 舉辦的鐵人賽(當時的系列文:那些在科技公司和 app 背後的資料科學),當時的我才剛畢業,甫入職場,對機器學習專案的想像很扁平。在學生時期,以為只要搜集好資料、訓練好模型,整個機器學習專案就算結束,當時的系列文也只著重於探討模型演算法本身。
不過,在經過兩年的職場洗禮後,我才深刻體認到(machine learning,ML)專案其實包含相當繁複的步驟,不僅僅是訓練模型而已。因此,在今年的鐵人賽中,我決定好好探討一個完整 ML 專案會經歷的所有步驟,同時一樣借力於科技巨頭的經驗,介紹他們在每個步驟的實作方法,正所謂站在巨人的肩膀上才能看的更遠。
首先,我們會先探討機器學習系統中容易被忽略的技術債問題,接著介紹 Andrew Ng 認為一個完整的機器學習專案應該包含的五個步驟。最後,我們會介紹一些實際在業界處理這五個步驟的方法,踩著別人的肩膀才能看得更遠!
那我們就開始 30 天的旅程吧!
謝謝讀到最後的你,如果喜歡這系列,別忘了按下喜歡和訂閱,才不會錯過最新更新。
如果有任何問題想跟我聊聊,或是想看我分享的其他內容,也歡迎到我的 Instagram(@data.scientist.min) 逛逛!
我們明天見!