在前面我們介紹了 RAG 與 RAGAS,這些方法主要是解決 『如何讓 LLM 回答得更正確』 的問題。但隨著應用需求不斷升級,其實不少學者也開始思考:如果我們希望 AI 不只是回答問題,而是能主動規劃、執行任務呢? 於是乎 AI Agent 的概念也逐漸浮現,這也是現今不少人在研究的議題之一,所以接下來我們也會朝著這方面去做學習,讓我們開始吧!
在了解 AI Agent 之前,我覺得我們可以先來定義甚麼是 Agent。
代理:是一種利用人工智慧模型與其環境互動以實現使用者定義目標的系統。它結合推理、規劃和動作執行(通常透過外部工具)來完成任務。
這部分只是初略的介紹,我們可以更深入到一個完整的 Agent 至少應該具備哪些能力。
此外,HuggingFace 的教程也提供了一個簡單的流程示意,幫助我們理解 Agent 的運作:
總結來說,就是結合理性推論、計畫與外部工具執行,去完成使用者設定的任務。
上面有說到一般「Agent」是指任何能感知、決策與行動的系統,範圍可以很大(像機器人、遊戲角色)。
AI Agent 特別強調的是:決策與推理由 AI 模型(尤其是 LLM, Large Language Model)驅動。
它跟傳統程式的不同點:
所以簡單來說,AI Agent 就是「Agent 的基本特性」+「LLM 的推理能力」。
不過,光有定義還不夠,我們還需要拆解它裡面有哪些核心模組,不過我們會放到明天再繼續說明~~