- MLOps 混合雲的實踐
- LLM 簡介與 MLOps 關係
- 使用 MLOps & LLMOps 的工具與生態圈
- Databricks, Azure Machine Learning
- MLflow
一般來說,針對 Machine Learning workflow 有幾個大方向的建議: 針對每個階段 (stage) 都有獨立的環境。例如:開發、測試、產品...
以下針對 Staging stage 的重點部分作說明。 Staging stage 的重點在於測試 ML pipeline 的程式碼,確保它可以準備好進入 P...
以下針對 Production stage 的重點部分作說明。 ML engineers 擁有 production 環境的權限,也就是可以佈署 ML pipe...
PrimeHub 是以 Kubernetes 為基礎針對加速資料科學/機器學習研究開發而設計的平台。藉由專案群組為中心的設計概念,資料科學家可以輕易與專案成員共...
先把 PrimeHub 架構跟相關圖放上好了。 架構圖 Data Model 從之前探討的 MLOps 的流程,首先是 MLOps = DevOps + Dat...
由前兩篇的簡介與比較,另外加上實際操作來說明使用 PrimeHub Solution 的好處與未來的期待。 好處 對於 IT 部門來說,透過 PrimeHub...
Ray 是一個分散式運算框架,可以讓你的程式碼在多台機器上執行,並且可以自動管理資源的分配與調度。舉例來說,當在單一機器上執行 Ray applications...
Ray Cluster 一個 Ray Cluster 需要一個 Head Node 與多個 Worker Node Head Node 負責管理 Worker...
從前兩篇的介紹可以知道,Ray 基本上就是可以架設在 Kubernetes 上的分散式運算框架,所以我們要先準備好 Kubernetes 的環境,才能夠進行 R...
安裝 Ray 與相關套件 安裝 Python & pip sudo apt install python3 python3-pip sudo...