iT邦幫忙

1

人工智慧模型 LLM (單一模型) 與 人工智慧代理 AI Agent(人工智慧代理)是什麼?兩者之間的關鍵差異?

  • 分享至 

  • xImage
  •  

LLM(Large Language Model)

本質上是一個經過巨量文本數據訓練的深度學習模型(通常是基於 Transformer 架構)。它的核心能力是:

預測下一個詞元 (Token Prediction):
根據前面輸入的文本序列,預測最可能出現的下一個詞彙或詞元。

語言理解與生成:
能夠理解人類的自然語言指令(Prompt)並生成連貫、相關且富有邏輯的文本輸出。

當我們談論「單一模型」時,它主要依賴以下兩部分來完成任務:

訓練數據知識:
模型的所有知識都固化在它訓練時所讀取的數據中。因此,它的知識是靜態的,有時間上的截止點。

上下文窗口:
這是模型的短期記憶。它允許模型在單次對話中回顧並引用前面的輸入和輸出的內容。但這個窗口的長度是有限的(例如 32k 或 128k 個詞元)。超過這個限制,早期的內容就會被「遺忘」。

LLM 單一模型的運作方式:
LLM 單一模型的運作是被動且單線的。

接收輸入 (Prompt):用戶提出一個問題或指令。

推理生成 (Inference):模型利用其訓練知識和上下文窗口,進行計算和推理。

單次輸出 (Output):模型生成單次、完整的文本回覆。

它不會主動去想:「我需要上網查資料」,也不會說:「這個問題太複雜了,我要把它分解成三個步驟」。它只專注於生成與輸入最相關、最連貫的文本。

知識時效性:無法獲取訓練截止日期之後發生的資訊。

複雜任務處理:難處理需要多步驟規劃、試錯和長期記憶的複雜任務。

運算準確性:對於複雜的數學計算或邏輯操作容易出錯。

狀態維持:無法在長時間或多回合任務中保持連貫的長期狀態。

AI Agent

是近年來在 AI 領域中熱門的概念,它是一種能夠在環境中感知、決策並採取行動,以達成特定目標的軟體系統或實體。
它不僅僅是一個大型語言模型(LLM),而是將 LLM 的能力與規劃、記憶、工具使用等機制結合起來,使其能夠獨立完成複雜任務。
AI Agent 的應用與價值是從「被動接收指令」轉變為「主動解決問題」。

AI Agent 的核心組成部分一個功能完整的 AI Agent 通常包含以下四個關鍵要素(類似人類解決問題的過程):

  1. 模型 (Model / 大腦)這是 Agent 的核心推理單元。
    功能:
    接收輸入,理解上下文,並進行複雜的推理和規劃。

技術基礎: 通常是大型語言模型 (LLM),如 GPT-4、Gemini 等。

  1. 記憶 (Memory)Agent 需要儲存資訊來維持上下文和學習。
    短期記憶 (Short-term Memory): 類似於 LLM 的上下文窗口,用於處理當前回合的對話或任務細節。
    長期記憶 (Long-term Memory): 用於儲存大量過去的經驗、學到的知識、以及重要資訊,通常透過向量資料庫 (Vector Database) 實現,讓 Agent 能在需要時檢索相關舊資訊。

  2. 工具 (Tools / 行動能力)讓 Agent 能跳脫 LLM 自身限制,與外部世界互動。
    功能:
    執行 LLM 無法直接完成的操作,例如:使用 Google 搜尋獲取即時資訊。
    執行 Python 代碼進行數學計算或數據處理。
    調用 外部 API (例如:訂機票、發送郵件、操作資料庫

  3. 規劃與決策 (Planning & Reasoning)這是 Agent 實現自主性的關鍵。
    功能:
    將複雜的目標分解為可管理的、一步一步的子任務 (Sub-tasks),並根據當前環境和記憶來調整策略。
    自我修正 (Self-Correction): 在執行過程中,Agent 會評估每一步的結果。如果遇到錯誤或與預期不符,它可以反思 (Reflection) 並重新規劃下一步行動。

知識時效性:透過 Web 搜索或 API 獲取即時資訊。

複雜任務處理:將大目標分解成可執行的小步驟。

運算準確性:透過代碼解釋器 (Code Interpreter) 或計算器執行精確運算。

狀態維持:透過向量資料庫實現長期、可檢索的記憶。

LLM與AI Agent的關鍵差異

資料庫:LLM的資料庫只能比對精準的詞或文字。AI Agent則能匹配出相關的詞或文字。

範例,當今天你要搜尋「風景推薦」。在LLM上搜尋,則只會出現有「風景推薦」的結果,而其他相關的「高cp值風景區」、「必來風景」等等就不會顯示在搜尋結果上。
而今天把相同的「風景推薦」在AI Agent中搜尋,它不只會出現「風景推薦」的結果,還會出現
相關的文字或意思的「高cp值風景區」、「必來風景」結果。
相比之下,大家想要搜尋到的結果應該是第二種AI Agent那種結果。當搜尋的字沒很準確表達問題,但還是想要除了那問題之外,相關或相同意思的結果。而這就是AI Agent的向量資料庫跟以往資料庫不同的突破。

知識時效性:LLM是靜態的。知識於訓練日期的日期以前,無法獲取實時資訊。AI Agent則可獲取最新資訊。

/images/emoticon/emoticon78.gif


圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言