iT邦幫忙

2023 iThome 鐵人賽

DAY 26
0
AI & Data

MLOps/LLMOps - 從零開始系列 第 26

Day26 - LLMs on Ray

  • 分享至 

  • xImage
  •  

終於要來看有關 LLMs (Large Language Models) with Ray 這個主題,Ray Cluster 的主要開發商 Anyscale 除了提出之前提到的 Ray Serve 作 Model Serving,當然也支援 LLM 的 Serving。而 RayLLM (formerly known as Aviary) 算是直接針對 LLM 的 Solution.

  • 提供一系列,預先配置好的 Open source LLMs,並且預設值可以直接使用。
  • 支援 Hugging Face Hub 或是本地端的 Transformer Model。
  • 簡化同時佈署多個 LLMs 上線。
  • 簡化加入新的 LLMs 的流程。
  • 支援 autoscaling ,包含 scale-to-zero。
  • 支援多 GPU 與多節點的模型部署。
  • 提供高效能的特性,像是 continuous batching, quantization and streaming。
  • 提供類似 OpenAI 的 REST API,讓遷移與測試更容易。

而且提供 anyscale/aviary Docker image,pip install,或是 Ray Cluster 的方式來使用。
下一篇會來 踩雷 試試看。

https://ithelp.ithome.com.tw/upload/images/20231011/20091643UjafdA9uGX.png

Reference:


上一篇
Day25 - Ray Tune
下一篇
Day27 - LLMs on Ray (踩雷?)
系列文
MLOps/LLMOps - 從零開始30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言