iT邦幫忙

鐵人檔案

2023 iThome 鐵人賽
回列表
AI & Data

踏上 MLOps 之路:從 Applied Data Scientist 到 MLOps 的轉變與建構 系列

這系列文章我會以一個 Data Scientist 的角度,並以一個 Fintech 公司實際的例子,來分享我們怎麼在雲上或開源專案中建立一個系統來解決以下問題:
- 如何減少從 Experiment 實作到 Serving Pipeline 遇到鬼的
- 如何化解 Data Scientist 間的穀倉效應,並讓 DS 間可以互相合作
- 如何整理雜亂的訓練資料並不會被埋沒在奇怪命名的研究結果汪洋中
- 如何安心的睡覺,不用擔心模型壞掉

鐵人鍊成 | 共 30 篇文章 | 8 人訂閱 訂閱系列文 RSS系列文
DAY 21

Day 21 Error Handling and Status Code

在進到 Health Check Monitoring 前,先講兩個我認為在部署 Inference Service 常會遺漏的兩個事情: Error Hand...

2023-09-25 ‧ 由 tonywang10101 分享
DAY 22

Day 22 Health Check Based Monitoring

昨天提到 Timeout 的其中一個原因,就是機器資源不足或是超載的異常,當大量的 Request 發生時,可能會讓機器在 Memory, Disk, CPU...

2023-09-26 ‧ 由 tonywang10101 分享
DAY 23

Day 23 Alarm & Dashboard

監控除了 Alarm 之外,最重要的就是 Dashbaord,但是監控並不是越多越好,就和 Alarm 一樣,Alarm 和 Dashboard 的目的就是要把...

2023-09-27 ‧ 由 tonywang10101 分享
DAY 24

Day 24 Explain Ai

最後一個主題,介紹一下 Explain AI,目的是為的達到可解釋性,幫著使用方解釋和理解模型 為什麼需要可解釋性? 信任和接受度: 使用者更可能信任和接受...

2023-09-28 ‧ 由 tonywang10101 分享
DAY 25

Day 25 Unstructured Data

到目前為止我們算是把 Binary Classification 中和 MLOps 有關的部分講告一個段落了,昨天做後講到關於 Computer Vision...

2023-09-29 ‧ 由 tonywang10101 分享
DAY 26

Day 26 Inference Server

在 Unstructured Data 中計算效能變得格外重要,而計算效能不外乎是平行化, 分散式 和 Caching 三大方向,當然也會針對演算法去做優化,像...

2023-09-30 ‧ 由 tonywang10101 分享
DAY 27

Day 27 LLMOps

前天提到了優化應該不要想說把你的所有 Unstructured Data 都想要用同一個方式來處理,舉例來說把影像辨識, OCR, Sentence Comp...

2023-10-01 ‧ 由 tonywang10101 分享
DAY 28

Day 28 The Whole Picture

回顧 27 天,嘗試做了我對 MLOps 的理解: 順著文章思路,對於一個 Binary Classification 我分成三個區塊,並把這三個區塊我認為重...

2023-10-02 ‧ 由 tonywang10101 分享
DAY 29

Day 29 DS vs MLE vs DE vs MLOps ...

這一篇我會以非常主觀的方式並根據我的觀察來描述一些 Data Team 常見的職位,然而每一間公司對每個職位的定義通常有非常大的差異,最準確的方式絕對是根據 J...

2023-10-03 ‧ 由 tonywang10101 分享
DAY 30

Day 30 Keep Learning MLOps

記得要開始寫這篇的時候,一直在想什麼是 MLOps,第一個想法,應該就是 Machine Learning 界的 DevOps 吧,但很好我又不知道什麼是 De...

2023-10-04 ‧ 由 tonywang10101 分享