在 Day19 的內容中,我們學會了如何使用 Chat Trigger
節點,為我們的 n8n 工作流程打造一個聊天機器人的入口。
現在,我們的機器人已經準備好接收訊息了,下一步就是賦予它一個聰明的大腦——這就是 AI Agent 與 大型語言模型(LLM) 登場的時刻。
這篇文章會接續上一篇的進度,帶你深入了解 AI Agent 的核心,並專注於如何選擇最適合你的大型語言模型,以及如何調整其中的關鍵參數,讓你的 AI Agent 更聰明、更符合需求。我們將以 Google 強大的 Gemini 模型作為主要範例。
如果你剛接觸 AI,可能會對這兩個名詞感到困惑。讓我們用一個簡單的比喻來解釋:
當你給 AI Agent 一個指令,例如「幫我找出今天台北天氣如何,並把結果寄給我」,它的運作流程會是:
在 n8n 中,「AI Agent」節點就是扮演這個指揮官的角色,而我們要做的,就是為這位指揮官挑選一個合適的大腦(LLM),並教會它如何使用各種工具。
延續 Day19 的工作流程,現在我們要在 Chat Trigger
節點後面,接上 AI Agent
節點。
Chat Trigger
節點後方點擊 +
,搜尋並加入 AI Agent 節點。+
按鈕,這時會彈出 n8n 支援的各種大型語言模型讓你選擇。這一步就像是為你的 AI Agent 挑選大腦,而這個選擇將直接決定 Agent 的能力、速度與成本。
n8n 內建了許多主流的 LLM 供你選擇,包括 OpenAI、Google Gemini、Azure OpenAI、Groq、Ollama 等。每個模型都有其獨特的優勢和適用場景。
以下是一些常見的選擇考量:
模型 | 優勢 | 適合場景 | 注意事項 |
---|---|---|---|
Google Gemini | 強大的多模態能力(文字、圖片、聲音),性價比高,與 Google 生態系整合佳。 | 需要處理圖片或影片內容、重視成本效益、需要最新資訊的任務。 | API 金鑰需要在 Google AI Studio 中申請。 |
OpenAI (GPT) | 技術成熟穩定,社群資源豐富,多數開發者最熟悉。 | 通用型任務、複雜的邏輯推理、需要快速開發驗證的專案。 | 較新的模型(如 GPT-4o)成本可能較高。 |
Groq | 極致的推論速度,反應極快,適合需要即時回應的應用。 | 即時問答客服、對話式 AI、需要低延遲的場景。 | 模型選擇相對較少,但速度是其最大賣點。 |
Ollama | 可在本機端運行,確保資料隱私,無需支付 API 費用。 | 處理敏感資料、內部系統整合、學習與實驗用途。 | 需要自行準備硬體設備,並承擔維護成本。 |
對於剛入門的開發者,Google Gemini 是一個非常推薦的起點。它的 gemini-1.5-flash
模型在速度、能力和成本之間取得了絕佳的平衡,非常適合用來打造各種類型的 AI Agent。
當你選擇了 Google Gemini Chat Model
並連接到 AI Agent 後,點開 Gemini 節點,你會看到一系列可以調整的參數。這些參數就像是大腦的「旋鈕」,透過調整它們,可以精準控制 AI 的輸出行為。
讓我們來看看幾個最重要的參數:
這裡可以選擇你要使用的具體 Gemini 模型版本。
gemini-1.5-pro
:目前最強大的模型,擁有最大的上下文視窗(Context Window),適合處理極度複雜的長文分析或多輪對話。gemini-1.5-flash
:速度更快、成本更低的輕量版模型,在多數場景下表現已非常出色,是兼顧效能與成本的最佳選擇。gemini-1.0-pro
:上一代的主力模型,穩定可靠。建議:除非你的任務極其複雜,否則從 gemini-1.5-flash
開始是最好的選擇。
建議:一般任務設為 0.7
左右。如果需要精確的答案,可以降至 0.2
;如果需要創意發想,可以調高至 1.0
或更高。
Top P
設為 0.9
表示模型只會從機率總和達到 90% 的詞彙中挑選下一個字。Temperature
像是調整「驚喜程度」,而 Top P
則是限制「選擇範圍」。建議:多數情況下,保持預設值 1
,專注調整 Temperature
即可。
Top K
設為 40
,模型就只會從最可能的 40 個字中挑選。Top K
的限制比 Top P
更直接,可能會讓輸出顯得比較呆板。建議:除非有特殊需求,否則保持預設值即可。
恭喜你!你已經完成了打造 AI Agent 最關鍵的一步:為它安裝並設定了一個強大的大腦。
我們今天學習了:
Temperature
等關鍵參數,微調 AI 的行為模式。現在,你的 AI Agent 已經能夠進行聰明的對話了。不過,它還是一個只會「說」不會「做」的 Agent。
在接下來的篇章中,我們將學習如何為它連接各種「工具」,讓它能夠查詢網路、讀寫檔案、操作你的各種應用程式,成為一個真正能為你分勞解憂的超級助理!