iT邦幫忙

鐵人檔案

2023 iThome 鐵人賽
回列表
AI & Data

踏上 MLOps 之路:從 Applied Data Scientist 到 MLOps 的轉變與建構 系列

這系列文章我會以一個 Data Scientist 的角度,並以一個 Fintech 公司實際的例子,來分享我們怎麼在雲上或開源專案中建立一個系統來解決以下問題:
- 如何減少從 Experiment 實作到 Serving Pipeline 遇到鬼的
- 如何化解 Data Scientist 間的穀倉效應,並讓 DS 間可以互相合作
- 如何整理雜亂的訓練資料並不會被埋沒在奇怪命名的研究結果汪洋中
- 如何安心的睡覺,不用擔心模型壞掉

鐵人鍊成 | 共 30 篇文章 | 8 人訂閱 訂閱系列文 RSS系列文
DAY 11

Day 11 Model Comparison

當有一個新的模型要來替換目前線上在使用的模型時,通常需要經過一連串的比較,除了透過像是 Accuracy, Pcrecision, Recall 等 Metri...

2023-09-15 ‧ 由 tonywang10101 分享
DAY 12

Day 12 Model Governance

首先我們先複習一下,當一個訓練階段完成時,會有哪些東西:當我們有了一個已經訓練好的模型,我們需要把他包裝成可以輸出的模型,除了常見的將 Model Dump 成...

2023-09-16 ‧ 由 tonywang10101 分享
DAY 13

Day 13 Bias, Label and AutoML, Experiment Summarize

在進入後續的 Serving Pipeline 環節之前,我們最後用一天討論一下 Auto ML,Auto ML 的目的是希望將整個訓練的過程,變成一個完全自動...

2023-09-17 ‧ 由 tonywang10101 分享
DAY 14

Day 14 Serving 架構

Serving 其實包括了很多 Load Balance, Micro service architecture design 和 data flow desi...

2023-09-18 ‧ 由 tonywang10101 分享
DAY 15

Day 15 Sync Features

前面所說的 Sync Features 又可以再細分為 Streaming Features 和 Realtime Features Streaming Fe...

2023-09-19 ‧ 由 tonywang10101 分享
DAY 16

Day 16 Realtime Join: Asynchronous Mindset

前面提到 Synchronous Features 和 Asynchronous Features 的差異,換句話說也就是 Realtime 和 Batch F...

2023-09-20 ‧ 由 tonywang10101 分享
DAY 17

Day 17 Async Feature Airflow

前面所說的 Asynchronous Features 通常我又稱 Batch Features,這類 Batch Features 的特點是: 適合大量的、...

2023-09-21 ‧ 由 tonywang10101 分享
DAY 18

Day 18 Feature Store

過去我們談了關於 Synchronous Feature (Realtime Feature) 和 Asynchronous Feature (Batch Fe...

2023-09-22 ‧ 由 tonywang10101 分享
DAY 19

Day 19 Data Collector Based Monitoring

過了 Research 和 Serving 環節,接著進入 Monitoring 環節,我認為如果一個資料科學團隊要開始搭建 MLOPs 系統,最先要開始的絕對...

2023-09-23 ‧ 由 tonywang10101 分享
DAY 20

Day 20 Feature Storage Based Monitoring

第二類型的監控 Feature Storage Based Monitoring ,更偏重是一個更長窗口的計算,換句話說前一個 Data Collector...

2023-09-24 ‧ 由 tonywang10101 分享