iT邦幫忙

2021 iThome 鐵人賽

DAY 23
0

再現性是指在這個模型產生出來以後,由不同的開發者或利益相關者,重新創建相同 ML 模型的能力。這其中牽涉到同時減少過程中涉及的隨機性。透過重現來驗證端到端的開發過程,並提供用於最終會上線版本的模型必經過程,以滿足監管要求。講得更誇張一點就是,“讓一個不懂ML的工程師來跑這些程式碼,也要能獲得一樣的結果。”

在前面的系統監管,我們已經提過要讓系統經得起第三方的審查,所有資料的重現都是重要的。


*圖片來源:MLOPS: TRACKING AND APPROVING MODELS

顯示了進階的模型沿襲(model lineage),包括以下步驟來審核模型的預測。

首先我們需要知道在推理過程中使用了什麼程式碼:

  • 生成的每個物件(像是整理過的資料、模型)都需要一個版本號
  • 每個預測都需要使用該版本號紀錄

對於版本化的物件或模型,您需要從創建它的訓練中了解以下內容:

  • 用於訓練的超參數和設置
  • 程式碼在Git管理中的位置及其修訂版
  • 演算法、框架和任何其他依賴的版本號
  • 資料集需要進行版本控制並存儲在允許檢索的地方。可以使用 SageMaker Feature Store、Dynamo DB 或 S3儲存。
  • 批准過程可以是自動的或手動的,提供對模型是否獲得批准以及誰批准的清晰審計

資料集本身:

  • 數據來源
  • 處理資料的程式碼,例如處理缺失數據

上一篇
MLOps在金融產業:模型監控(資料漂移與特徵漂移)
下一篇
案例:自動化文件訊息提取
系列文
談MLOps - 模型、專案架構、產品化及維運29
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言