iT邦幫忙

2025 iThome 鐵人賽

DAY 20
0
Odoo

打造簡單 AI ERP/CRM 應用:零基礎 30 天你也能用 Odoo 和 n8n 做到系列 第 20

【Day20】n8n AI Agent 指南:如何挑選與設定你的 LLM?

  • 分享至 

  • xImage
  •  

在 Day19 的內容中,我們學會了如何使用 Chat Trigger 節點,為我們的 n8n 工作流程打造一個聊天機器人的入口。

現在,我們的機器人已經準備好接收訊息了,下一步就是賦予它一個聰明的大腦——這就是 AI Agent大型語言模型(LLM) 登場的時刻。

這篇文章會接續上一篇的進度,帶你深入了解 AI Agent 的核心,並專注於如何選擇最適合你的大型語言模型,以及如何調整其中的關鍵參數,讓你的 AI Agent 更聰明、更符合需求。我們將以 Google 強大的 Gemini 模型作為主要範例。

什麼是 AI Agent?它和 LLM 有何不同?

如果你剛接觸 AI,可能會對這兩個名詞感到困惑。讓我們用一個簡單的比喻來解釋:

  • 大型語言模型(LLM):就像一個博學多聞、但只能待在圖書館裡的「大腦」。它讀遍了全世界的書,擁有驚人的知識與語言能力。你問它問題,它能給你精準的回答;你讓它寫作,它能產出優美的文章。但它本身無法離開圖書館去「做」任何事。例如:OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude 都是頂尖的 LLM。
  • AI Agent:就像一個擁有「大腦、目標和手腳」的完整個體。它不僅內建了 LLM 這個聰明的大腦,更重要的是,它被賦予了「目標導向」的能力,並且懂得如何使用外部「工具」來完成任務。

當你給 AI Agent 一個指令,例如「幫我找出今天台北天氣如何,並把結果寄給我」,它的運作流程會是:

  1. 思考:運用 LLM 的大腦,理解任務是「查詢天氣」和「寄送郵件」。
  2. 規劃:將任務拆解成 (1) 呼叫天氣查詢工具 (2) 呼叫郵件寄送工具。
  3. 行動:實際去使用這些工具,取得天氣資訊,然後撰寫並寄出郵件。
  4. 完成:向你回報任務已完成。

在 n8n 中,「AI Agent」節點就是扮演這個指揮官的角色,而我們要做的,就是為這位指揮官挑選一個合適的大腦(LLM),並教會它如何使用各種工具。

如何在 n8n 中設定 AI Agent 與 LLM?

延續 Day19 的工作流程,現在我們要在 Chat Trigger 節點後面,接上 AI Agent 節點。

  1. Chat Trigger 節點後方點擊 +,搜尋並加入 AI Agent 節點。
  2. 點開 AI Agent 節點,你會看到下方有多個可以連接的插槽,最重要的就是第一個 Chat Model
  3. 點擊 Chat Model+ 按鈕,這時會彈出 n8n 支援的各種大型語言模型讓你選擇。

這一步就像是為你的 AI Agent 挑選大腦,而這個選擇將直接決定 Agent 的能力、速度與成本。

LLM 模型選擇:為你的 Agent 挑選合適的大腦

n8n 內建了許多主流的 LLM 供你選擇,包括 OpenAI、Google Gemini、Azure OpenAI、Groq、Ollama 等。每個模型都有其獨特的優勢和適用場景。

以下是一些常見的選擇考量:

模型 優勢 適合場景 注意事項
Google Gemini 強大的多模態能力(文字、圖片、聲音),性價比高,與 Google 生態系整合佳。 需要處理圖片或影片內容、重視成本效益、需要最新資訊的任務。 API 金鑰需要在 Google AI Studio 中申請。
OpenAI (GPT) 技術成熟穩定,社群資源豐富,多數開發者最熟悉。 通用型任務、複雜的邏輯推理、需要快速開發驗證的專案。 較新的模型(如 GPT-4o)成本可能較高。
Groq 極致的推論速度,反應極快,適合需要即時回應的應用。 即時問答客服、對話式 AI、需要低延遲的場景。 模型選擇相對較少,但速度是其最大賣點。
Ollama 可在本機端運行,確保資料隱私,無需支付 API 費用。 處理敏感資料、內部系統整合、學習與實驗用途。 需要自行準備硬體設備,並承擔維護成本。

對於剛入門的開發者,Google Gemini 是一個非常推薦的起點。它的 gemini-1.5-flash 模型在速度、能力和成本之間取得了絕佳的平衡,非常適合用來打造各種類型的 AI Agent。

Gemini 模型參數詳解:微調你的 AI 大腦

當你選擇了 Google Gemini Chat Model 並連接到 AI Agent 後,點開 Gemini 節點,你會看到一系列可以調整的參數。這些參數就像是大腦的「旋鈕」,透過調整它們,可以精準控制 AI 的輸出行為。

讓我們來看看幾個最重要的參數:

1. Model(模型)

這裡可以選擇你要使用的具體 Gemini 模型版本。

  • gemini-1.5-pro:目前最強大的模型,擁有最大的上下文視窗(Context Window),適合處理極度複雜的長文分析或多輪對話。
  • gemini-1.5-flash:速度更快、成本更低的輕量版模型,在多數場景下表現已非常出色,是兼顧效能與成本的最佳選擇。
  • gemini-1.0-pro:上一代的主力模型,穩定可靠。

建議:除非你的任務極其複雜,否則從 gemini-1.5-flash 開始是最好的選擇。

2. Temperature(溫度)

  • 數值範圍:0 到 2 之間。
  • 作用:控制輸出的「創意程度」或「隨機性」。
  • 數值越高:AI 的回答會更有創意、更多樣化,但可能偏離主題或出現不精確的內容。適合用於寫詩、想點子、寫行銷文案。
  • 數值越低:AI 的回答會更穩定、更具確定性,每次都可能給出相似的答案。適合用於寫程式碼、處理客服問題、進行資料分類。

建議:一般任務設為 0.7 左右。如果需要精確的答案,可以降至 0.2;如果需要創意發想,可以調高至 1.0 或更高。

3. Top P

  • 數值範圍:0 到 1 之間。
  • 作用:另一種控制隨機性的方式。它會從機率最高的詞彙中進行抽樣。例如,Top P 設為 0.9 表示模型只會從機率總和達到 90% 的詞彙中挑選下一個字。
  • 與 Temperature 的關係:通常建議只調整其中一個。Temperature 像是調整「驚喜程度」,而 Top P 則是限制「選擇範圍」。

建議:多數情況下,保持預設值 1,專注調整 Temperature 即可。

4. Top K

  • 作用:直接限制模型只能從機率最高的 K 個詞彙中選擇下一個字。例如 Top K 設為 40,模型就只會從最可能的 40 個字中挑選。
  • 與 Top P 的關係Top K 的限制比 Top P 更直接,可能會讓輸出顯得比較呆板。

建議:除非有特殊需求,否則保持預設值即可。

結語:你的第一個 AI Agent 大腦已上線

恭喜你!你已經完成了打造 AI Agent 最關鍵的一步:為它安裝並設定了一個強大的大腦。

我們今天學習了:

  • AI Agent 與 LLM 的根本區別。
  • 如何在 n8n 中為 AI Agent 選擇合適的 LLM,例如 Google Gemini。
  • 如何透過調整 Temperature 等關鍵參數,微調 AI 的行為模式。

現在,你的 AI Agent 已經能夠進行聰明的對話了。不過,它還是一個只會「說」不會「做」的 Agent。

在接下來的篇章中,我們將學習如何為它連接各種「工具」,讓它能夠查詢網路、讀寫檔案、操作你的各種應用程式,成為一個真正能為你分勞解憂的超級助理!


上一篇
【Day19】 n8n Chat Trigger 節點:打造你的第一個聊天機器人
下一篇
【Day21】n8n AI Agent 的溝通藝術:掌握 Prompt 指令
系列文
打造簡單 AI ERP/CRM 應用:零基礎 30 天你也能用 Odoo 和 n8n 做到24
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言