Day 6: Agent 你知道今天是什麼日子嗎？- Memory

2025 iThome 鐵人賽

DAY 6

生成式 AI

agent-brain: 從 0 開始打造一個 python package系列第 6 篇

17th鐵人賽

aquila_w

2025-09-20 23:01:24

100 瀏覽

分享至

今天我們來探討 LLM Agent 上的 Memory 記憶機制

論文

畢竟是 2024 年的論文了，論文在 memory 這個 component 上只分析了兩大方向

RAG-based Memory
用 similary search 找出與目前 scenario 最相近的過往的記憶。
Embodied Memory
直接透過更改 model 的 params 來達到記憶的效果。

但其實在現在由於 model 越來越強，能吃的 input token 也越來越多，直接把 context 當作是 memroy 同時送給 gpt 也不失是一種最暴力且有效的方法。

RAG-based Memoy

What is RAG?
RAG stand for Retrieval-Augmented Generation（檢索增強生成），核心做法是把記憶與embedding 用某個外部儲存系統 (vector db) 存起來，使用時先用 similary search 將與目前任務最相關的“記憶”取回，再交給生成模型整合回答。經典做法把向量索引（常見如 FAISS）當「非參數化記憶」。

RAG [1] 流程

圖中可以看到主要有兩個 components:
retriever & generator

retriever

首先問題進到 retriever 後，

會先透過 query encoder 轉成 vector
MIPS (Maximum Inner Product Search) 原來原始論文是這樣稱呼 similarity search XD
接下來看到有 document index，看了一下 paper 他是一個 pre-trained bi-encoder，主要用來 retireve documents

Generator

然後根據 document index 產生答案，這邊的 document index 應該也不是可讀文本，而是我們無法解釋的參數

那這樣有什麼好處？
把 retrieve 用在 tools 上應該很好理解。用在 LLM Agent 的 Memory，最主要的目的應該是，如果我們儲存了所有 multi-loop 的過成，那即使 llm context windows 變大了，一次餵給他可能也有太多雜訊，導致生成品質不好。
所以我們只需要 “參考” 與目前問題有關的歷史紀錄就好

Embodied Memory

Embodied是什麼意思？
在這裡的 embodied 指的是把「經驗」嵌進模型參數本身：用（全量或參數高效的）微調，讓代理在與環境互動所累積的軌跡、偏好與技巧，成為模型的內隱記憶，而不是放在外部向量庫。這通常靠 PEFT（如 LoRA、QLoRA、P-tuning、IA³）把需訓練的參數降到很小，降低成本與顯存需求。

為什麼要用 Embodied Memory?
當能力需要隱性技巧/模式（例如長期規劃、分解與行動選擇），把經驗「寫進參數」能讓模型少依賴提示工程、推理更穩定(?)。相對地，RAG 擅長事實/知識補全；embodied 則更像習得策略。上述工作均顯示在規劃/代理任務上，微調能帶來實質效益。

Catastrophic Forgetting 問題
微調有個好處是，訓練完後真的能在這部分的能力顯著提升，所以如果使用時的情境與微調時類似 (絕大部分沒問題)，但微調完後其他能力可能會明顯下降。