iT邦幫忙

2021 iThome 鐵人賽

DAY 16
1
自我挑戰組

PM職涯佈局的第N條成長曲線系列 第 16

Day 16 - 談談Data Science Cycle

https://ithelp.ithome.com.tw/upload/images/20210928/20112421XLetF8Csbx.png
圖片來源

這篇繼續來推薦Corporate Finance Institute (CFI)上的另一門很棒的免費Prep Course -  Data Science Fundamentals (資料科學基礎), 它的內容比AI-900還要更深入在說明一些數據預測相關的演算法細節, 比起Azure課程直接用了 AutoML就帶過了演算法的部分, 這個課程可以補足一些演算法的基礎知識, 此外課程中也補充了例如Ensemble Model的方法, 用多個AI演算法計算之後投票決定最後結果, 可改善單一演算法的誤判, 以及除了傳統上只拆分Training Data與Testing Data的模式, 說明了也可以再分出一部分Validation Data的其他做法 ; 其他在Evaluation章節中, 也補充說明了Underfitting與Overfitting的所造成的一些偏差與方差之權衡(Bias-Variance Tradeoff), 大大地補充了AI-900課程內容之外, 其他應該是在正統大學課程中講授機器學習與AI相關課程中會介紹的內容, 對於快速學習相關技術語言與資料科學家溝通討論上很有幫助 (自己的實務心得!!)

回過來談一下附圖的這個Data Science Cycle, 一大堆的Feedback Loop真的是要實際走過一次實際的案例後才能有深刻的感覺, 而且你可以發現很多的Loop都是回到最一開始的Business Understanding (Identify Project Objectives)也就是"定義問題", 因為一開始的目標明不明確? 太理想? 還是太模糊? 都影響了後續Data所需要提供的類型, 內容, 以及資料科學家用來建立AI Model的作法, 所以其實一開始就要把AI的應用問題定義清楚, 對於AI專案的成功與否, 其實影響力遠比後續的其他流程還要重要, Evalutaion(評估)的部分不用說, 以最終使用者(客戶)能否實際使用就立判高下, 但Deployment(部署)則又有很多細節在裡面, 畢竟AI只是工具, 除了運算資源是在地端還是雲端的考量之外, 還可能要考慮與其他系統的串接, 將AI預測的結果匯入既有運作流程的下一步, 只能說這些大的Loop已經面臨很多情況了, 更不用提在各別實作流程中, 若是採用敏捷式開發的方式, 有多少的Iteration(迭代)在每週(或每兩週)的過程中了!!  只能說學海無涯, 除了實務經驗持續累積之外, 也還是得繼續深耕!

突然有感於今日是2021年的928教師節, 能常常分享這麼多學習心得, 其實也有賴於當今多到數不清的線上課程與學習資源, 可以持續地終生學習~~~ 謝謝我所有曾經向您學習請教過的老師們, 教師節快樂!!

/images/emoticon/emoticon41.gif


上一篇
Day 15 - 從Business Intelligence(BI)到AI
下一篇
Day 17 - 成長曲線N+1 : AIGO教練培訓
系列文
PM職涯佈局的第N條成長曲線30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言