技術問答
技術文章
iT 徵才
Tag
聊天室
2025 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2023 iThome 鐵人賽
DAY
18
1
AI & Data
MLOps/LLMOps - 從零開始
系列 第
18
篇
Day18 - MLOps 自架環境之二: Ray Cluster 基本觀念與架構
15th鐵人賽
jimmyliao
2023-10-03 17:23:24
1134 瀏覽
分享至
Ray Cluster
一個 Ray Cluster 需要一個 Head Node 與多個 Worker Node
Head Node 負責管理 Worker Node,透過
autoscaler
來自動調整 Worker Node 的數量
基本上就是 follow Kubernetes 的 Pod 架構
Head Node
Head Node 會有一個 Ray Cluster 的 Controller,負責管理 Worker Node
Worker Node
負責執行 Ray Task,並將結果回傳給 Head Node
Autoscaling
在 head node 上面的一個 process,如果需求的 Ray workload 超過現有的 Ray cluster 能力,則會自動增加 worker node。反之就會自動減少 worker node。
autoscaler 只會根據 task 與 actor 的需求來調整 worker node 的數量,而不是根據 application metrics 或是 physical resource utilization 來調整 worker node 的數量。
Ray Jobs
執行 Ray Job 的方式有兩種
透過 Ray Jobs API 執行 (建議方式)
在任一 node (worker node or head node) 上執行
ray start --head
執行 script
Ray Job API
Reference:
https://docs.ray.io/en/latest/cluster/key-concepts.html
https://docs.ray.io/en/latest/cluster/getting-started.html
留言
追蹤
檢舉
上一篇
Day17 - MLOps 自架環境之二: Ray Cluster 簡介
下一篇
Day19 - Ray Cluster 安裝之一: 基礎環境準備
系列文
MLOps/LLMOps - 從零開始
共
30
篇
目錄
RSS系列文
訂閱系列文
5
人訂閱
26
Day26 - LLMs on Ray
27
Day27 - LLMs on Ray (踩雷?)
28
Day28 - MLOps deployment patterns
29
Day29 - Ray on Databricks
30
Day30 - Summary: 寫在 "MLOps/LLMOps - 從零開始" 完賽後的心得
完整目錄
熱門推薦
{{ item.subject }}
{{ item.channelVendor }}
|
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
902
組
團體組數
37
組
累計文章數
19864
篇
完賽人數
529
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
看更多
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
17th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
linux
windows server
css
react
熱門問題
.NET C# 資料庫 CRUD 專案,實務上會怎麼安排單元測試 / 整合測試?xUnit 可以直接拿來寫整合測試嗎?
關於中華nokia數據機DHCP問題
OUTLOOK無法搜尋、無法建立索引且無法執行Windows Search
.NET FRAMEWORK 3.5 安裝
不能關機
鼎新ERP WorkFlow GP3升級到AiGP
Fortigate防火牆的選擇??
熱門回答
鼎新ERP WorkFlow GP3升級到AiGP
Fortigate防火牆的選擇??
.NET FRAMEWORK 3.5 安裝
關於中華nokia數據機DHCP問題
.NET C# 資料庫 CRUD 專案,實務上會怎麼安排單元測試 / 整合測試?xUnit 可以直接拿來寫整合測試嗎?
熱門文章
再見了 Ingress NGINX
[技術實戰] 拒絕雲端洩密!我用 Docker + Llama 3 打造工程師專用的「100% 離線」AI 研發資料庫
坊間ISO課程個人理解
Excel下拉選單自訂秘技,資料篩選更快速
【2025 最強 AI IDE】Kiro Spec Mode:30 分鐘從 0 做出可部署 AWS 專案,VS Code 真的要掰了
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}