運行大型語言模型(LLMs)可能會因為硬體要求高而變得困難。根據您的使用案例,您可以選擇通過API(如GPT-4)使用模型,或者在本地運行它。以下是一步一步的指南,幫助您開始運行LLMs。
APIs 是部署 LLMs 的便捷方式。以下是如何使用一些常見的私有和開源 LLM APIs。
選擇 LLM API 提供商
註冊並獲取 API Key
使用 API 進行請求
import openai
openai.api_key = 'your-api-key-here'
response = openai.Completion.create(
engine="text-davinci-003",
prompt="Hello, world!",
max_tokens=50
)
print(response.choices[0].text.strip())
相關學習資源
如果您希望在本地運行開源 LLMs,可以按照以下步驟進行。
選擇開源 LLM
使用 LM Studio 和同類型應用在本地運行模型
安裝 LM Studio。
選擇一個模型並下載,然後使用 LM Studio 運行。
參考 Run an LLM locally with LM Studio by Nisha Arya 的指南。
另一個選擇是 AnythingLLM : 相關教學
[推薦]適合搭配 python, RAG 開發的 Ollama :相關教學
使用 Hugging Face 的 Transformer
transformers
庫:
pip install transformers
from transformers import pipeline
generator = pipeline('text-generation', model='gpt2')
response = generator("Hello, world!", max_length=50)
print(response[0]['generated_text'])
優化提示可以大大改善 LLM 的輸出效果。以下是一些常見的提示工程技術。
零提示詞(Zero-shot)
prompt = "What is the capital of France?"
少量提示詞(Few-shot)
prompt = "Translate the following English sentences to French:\n\n1. Hello, how are you? -> Bonjour, comment ça va?\n2. What is your name? -> Comment tu t'appelles?\n3. Where is the nearest restaurant? -> Où est le restaurant le plus proche?\n4. How much does this cost? -> Combien ça coûte?"
思維鏈(Chain of Thought)與 ReAct
prompt = "First, let's consider the problem step by step. What is 5 plus 3? Then, what is the result multiplied by 2?"
相關學習資源
許多任務需要結構化的輸出,如嚴格的模板或JSON格式。以下是一些工具和方法。
使用 LMQL 指導生成
使用 Outlines 庫
相關學習資源
非相關的新聞:
優必選人型機器人 Walker S Lite 在中國極氪 5G 智慧工廠的實戰表現
看來人形機器人的發展比我想的快的多