【Day20】n8n AI Agent 指南：如何挑選與設定你的 LLM？

2025 iThome 鐵人賽

DAY 20

Odoo

17th鐵人賽 erp crm n8n ai agent

311 瀏覽

在 Day19 的內容中，我們學會了如何使用 Chat Trigger 節點，為我們的 n8n 工作流程打造一個聊天機器人的入口。

現在，我們的機器人已經準備好接收訊息了，下一步就是賦予它一個聰明的大腦——這就是 AI Agent 與 大型語言模型（LLM） 登場的時刻。

這篇文章會接續上一篇的進度，帶你深入了解 AI Agent 的核心，並專注於如何選擇最適合你的大型語言模型，以及如何調整其中的關鍵參數，讓你的 AI Agent 更聰明、更符合需求。我們將以 Google 強大的 Gemini 模型作為主要範例。

什麼是 AI Agent？它和 LLM 有何不同？

如果你剛接觸 AI，可能會對這兩個名詞感到困惑。讓我們用一個簡單的比喻來解釋：

大型語言模型（LLM）：就像一個博學多聞、但只能待在圖書館裡的「大腦」。它讀遍了全世界的書，擁有驚人的知識與語言能力。你問它問題，它能給你精準的回答；你讓它寫作，它能產出優美的文章。但它本身無法離開圖書館去「做」任何事。例如：OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude 都是頂尖的 LLM。
AI Agent：就像一個擁有「大腦、目標和手腳」的完整個體。它不僅內建了 LLM 這個聰明的大腦，更重要的是，它被賦予了「目標導向」的能力，並且懂得如何使用外部「工具」來完成任務。

當你給 AI Agent 一個指令，例如「幫我找出今天台北天氣如何，並把結果寄給我」，它的運作流程會是：

在 n8n 中，「AI Agent」節點就是扮演這個指揮官的角色，而我們要做的，就是為這位指揮官挑選一個合適的大腦（LLM），並教會它如何使用各種工具。

延續 Day19 的工作流程，現在我們要在 Chat Trigger 節點後面，接上 AI Agent 節點。

這一步就像是為你的 AI Agent 挑選大腦，而這個選擇將直接決定 Agent 的能力、速度與成本。

n8n 內建了許多主流的 LLM 供你選擇，包括 OpenAI、Google Gemini、Azure OpenAI、Groq、Ollama 等。每個模型都有其獨特的優勢和適用場景。

以下是一些常見的選擇考量：

模型	優勢	適合場景	注意事項
Google Gemini	強大的多模態能力（文字、圖片、聲音），性價比高，與 Google 生態系整合佳。	需要處理圖片或影片內容、重視成本效益、需要最新資訊的任務。	API 金鑰需要在 Google AI Studio 中申請。
OpenAI (GPT)	技術成熟穩定，社群資源豐富，多數開發者最熟悉。	通用型任務、複雜的邏輯推理、需要快速開發驗證的專案。	較新的模型（如 GPT-4o）成本可能較高。
Groq	極致的推論速度，反應極快，適合需要即時回應的應用。	即時問答客服、對話式 AI、需要低延遲的場景。	模型選擇相對較少，但速度是其最大賣點。
Ollama	可在本機端運行，確保資料隱私，無需支付 API 費用。	處理敏感資料、內部系統整合、學習與實驗用途。	需要自行準備硬體設備，並承擔維護成本。

對於剛入門的開發者，Google Gemini 是一個非常推薦的起點。它的 gemini-1.5-flash 模型在速度、能力和成本之間取得了絕佳的平衡，非常適合用來打造各種類型的 AI Agent。

當你選擇了 Google Gemini Chat Model 並連接到 AI Agent 後，點開 Gemini 節點，你會看到一系列可以調整的參數。這些參數就像是大腦的「旋鈕」，透過調整它們，可以精準控制 AI 的輸出行為。

讓我們來看看幾個最重要的參數：

這裡可以選擇你要使用的具體 Gemini 模型版本。

建議：除非你的任務極其複雜，否則從 gemini-1.5-flash 開始是最好的選擇。

建議：一般任務設為 0.7 左右。如果需要精確的答案，可以降至 0.2；如果需要創意發想，可以調高至 1.0 或更高。

數值範圍：0 到 1 之間。
作用：另一種控制隨機性的方式。它會從機率最高的詞彙中進行抽樣。例如，Top P 設為 0.9 表示模型只會從機率總和達到 90% 的詞彙中挑選下一個字。
與 Temperature 的關係：通常建議只調整其中一個。Temperature 像是調整「驚喜程度」，而 Top P 則是限制「選擇範圍」。

建議：多數情況下，保持預設值 1，專注調整 Temperature 即可。