iT邦幫忙

2025 iThome 鐵人賽

DAY 21
0

在前面我們介紹了 RAG 與 RAGAS,這些方法主要是解決 『如何讓 LLM 回答得更正確』 的問題。但隨著應用需求不斷升級,其實不少學者也開始思考:如果我們希望 AI 不只是回答問題,而是能主動規劃、執行任務呢? 於是乎 AI Agent 的概念也逐漸浮現,這也是現今不少人在研究的議題之一,所以接下來我們也會朝著這方面去做學習,讓我們開始吧!

在了解 AI Agent 之前,我覺得我們可以先來定義甚麼是 Agent。

代理:是一種利用人工智慧模型與其環境互動以實現使用者定義目標的系統。它結合推理、規劃和動作執行(通常透過外部工具)來完成任務。

這部分只是初略的介紹,我們可以更深入到一個完整的 Agent 至少應該具備哪些能力。


Agent 的特性

  1. 自主性(Autonomy):Agent 能夠獨立感知環境、做出決策並採取行動,而不需要外部的指示。
  2. 感知能力(Perception):Agent 具備感測能力,能透過使用感測器(sensors)獲取有關環境的資訊。
  3. 決策能力(Decision-making):Agent 基於所感知到的資訊來做決策,並選擇合適的行動以實現目標。
  4. 行動能力(Action):代理能執行動作,改變其所處環境的狀態。

此外,HuggingFace 的教程也提供了一個簡單的流程示意,幫助我們理解 Agent 的運作:

  1. 理解需求
  2. 規劃步驟
  3. 使用工具(使用咖啡機/使用 API 取得資料)
  4. 把結果回傳回來

總結來說,就是結合理性推論、計畫與外部工具執行,去完成使用者設定的任務。


定義 AI Agent

上面有說到一般「Agent」是指任何能感知、決策與行動的系統,範圍可以很大(像機器人、遊戲角色)。
AI Agent 特別強調的是:決策與推理由 AI 模型(尤其是 LLM, Large Language Model)驅動

它跟傳統程式的不同點:

  • 傳統程式 → 事先定義好的規則(if-else)。
  • AI Agent → 能依據自然語言輸入,透過 LLM 推理出任務步驟,並動態調用工具完成目標。

所以簡單來說,AI Agent 就是「Agent 的基本特性」+「LLM 的推理能力」
不過,光有定義還不夠,我們還需要拆解它裡面有哪些核心模組,不過我們會放到明天再繼續說明~~


上一篇
Day 20|實戰 RAGAs:量化檢索與生成的表現
下一篇
Day 22|AI Agent 核心模組:推理、規劃、工具呼叫與記憶
系列文
RAG × Agent:從知識檢索到智慧應用的30天挑戰22
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言