[Day 13] 文字生成「服務」

2024 iThome 鐵人賽

DAY 13

生成式 AI

RAG自己來系列：客服機器人系列第 13 篇

16th鐵人賽

iervn6341

團隊NUTC imac

2024-09-21 19:47:35

172 瀏覽

分享至

前一天講了 text-generation-webui，今天來講另一個也是拿來做文字生成工作的工具，Ollama

這次為何要使用這個呢，其原因也是我覺得 Ollama 某方面的表現優於 text-generation-webui，如 VRAM 使用量，生成速度等等的優點。

介紹 & 安裝

Ollama在 github 上有 8.5 萬顆星的 MIT 開源專案，它能讀的模型不像昨天的開源專案一樣，能支援各種不同的大型語言模型，Ollama 只能吃 ".gguf" 格式的模型，但其優點是將大型語言模型的權重儲存在記憶體(RAM)中，不再那麼依賴 VRAM 的硬體門檻。

安裝方法也極其簡單，首先先來到 ollama 的 repo 頁面

Linux 系統使用者只要輸入以下指令即可，windows 的話則需下載 exe 檔

curl -fsSL https://ollama.com/install.sh | sh

這邊特別注意那個`The Ollama API is now available at 127.0.0.1:11434`以後會考

可透過 systemctl 確認服務運行狀況

確認 status 為 active 狀態後就可以開始下載模型了

下載模型

官方也提供了一個與 Huggingface 相似的網站，專門拿來存放使用者們上傳的語言模型

本篇範例將使用 Google 釋出的 Gemma2

因此在終端中輸入 ollama pull gemma2 就可以下載模型了
(ollama pull 與 ollama run 的效果一樣，只是後者會在下載完模型後自動讀取模型)

下載完後我們可以透過 curl 工具確認模型的效果

curl http://127.0.0.1:11434/api/generate -d '{
  "model": "gemma2",
  "prompt":"Why is the sky blue?"
}'

[Day 12] 圖形化文字生成工具

[Day 14] 介紹文字生成框架 - Langchain

系列文

RAG自己來系列：客服機器人共 30 篇

RSS系列文訂閱系列文

4 人訂閱

完整目錄

直播研討會

{{ item.channelVendor }} {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

1064 組

團體組數

40 組

累計文章數

22195 篇

完賽人數

600 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js

IT邦幫忙

RAG自己來系列：客服機器人系列 第 13 篇