先把 PrimeHub 架構跟相關圖放上好了。
架構圖
Data Model
從之前探討的 MLOps 的流程,首先是 MLOps = DevOps + DataOps + ModelOps。
DevOps 需要有基本的 Dev/Staging/Production 的環境,而這部份在 PrimeHub 本身是基於同一個 Cluster,而需要另外從設計上來想辦法區分環境。
PrimeHub 使用自己定義的 PrimeHub File System (PHFS),可以透過 PrimeHub UI 來管理檔案,也可透過 PrimeHub SDK 來存取檔案。
此外,根據 DataOps 的基本概念,需要有一個 Data Catalog 來管理資料,而這部份 PrimeHub 目前應該是沒有提供,期待接下來的版本可以有這個功能。
這部份 PrimeHub 直接利用了 PrimeHub App 內建的 MLflow server,可以直接管理 MLflow 的 model registry,並利用原本的 Deployment,對於 Model Serving 可以透過底層的 Cluster 作簡單的 Scaling。
Reference: