iT邦幫忙

2023 iThome 鐵人賽

DAY 17
1
AI & Data

MLOps/LLMOps - 從零開始系列 第 17

Day17 - MLOps 自架環境之二: Ray Cluster 簡介

  • 分享至 

  • xImage
  •  

Ray 是一個分散式運算框架,可以讓你的程式碼在多台機器上執行,並且可以自動管理資源的分配與調度。舉例來說,當在單一機器上執行 Ray applications,而想在其他機器上執行時,只要在程式碼中加入 ray.init(address="auto") 即可。Ray 會自動偵測其他機器的資源,並且將程式碼分配到其他機器上執行。前提是你必須先架設一個 Ray Cluster。

A Ray cluster is a set of worker nodes connected to a common Ray head node. Ray clusters can be fixed-size, or they may autoscale up and down according to the resources requested by applications running on the cluster.

以中文來說,Ray Cluster 就是一個 Ray head node 與多個 Ray worker nodes 的集合。Ray cluster 可以是固定大小的,也可以根據應用程式的需求,自動調整 worker nodes 的數量。

  • 可以在 AWS and GCP, Azure 或是 vSphere 環境上架設 Ray Cluster。
  • 一般的 Kubernetes, 透過 KubeRay project 也可以支援安裝。

Reference:


上一篇
Day16 - MLOps 自架環境之一: PrimeHub 的好處與未來的期待
下一篇
Day18 - MLOps 自架環境之二: Ray Cluster 基本觀念與架構
系列文
MLOps/LLMOps - 從零開始30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言