回頭看這一路走來的過程,其實可以說是從零開始慢慢摸索出來的。
一開始我只是單純想搞懂 什麼是 Agent,怎麼樣能讓 AI 不只是回答問題,而是能自己拆解任務、用工具完成事情。
那時候還停留在理論階段,更多的是在看文件、理解架構,但隨著一步步實作,我才慢慢摸清楚整個生態的運作方式。
接著我們回顧一下這段目前為止的旅程( •̀ ω •́ )y
最初的重點放在 了解 Agent 概念,包括它的角色定位、與工具的互動方式,以及為什麼需要有 sub_agent 和 root_agent 的設計。
接下來就開始動手做,從 簡單的 Agent 實作 開始,把模型和 prompt 包裝成能處理任務的小助手。之後,我不只停留在本地測試,還特地 做出 API,讓 Agent 的功能能透過 RESTful 的方式被呼叫。這時候再搭配 Gradio,就能快速做出一個互動式介面,讓整個流程更直觀、更容易展示。
再往下走,就是引入 MCP Server。這一步的意義很不一樣,因為 MCP 讓 Agent 具備了「外掛式」的能力,不需要把所有工具都寫死在程式碼裡,而是透過 MCP 協議與外部服務對接。像 Spotify 這種娛樂應用、HackMD 這種筆記協作工具、SearXNG 這種搜尋引擎,就是最佳範例。這代表我的 Agent 不再只是「單一功能」,而是能根據需求切換不同的 sub_agent,實際調用不同的服務。
所以整體來看,這條路徑就像一層層堆疊的積木:從 理解 → 實作 → API → 介面 → 外部整合,到現在已經有點像是一個雛形系統了。這也讓我更清楚,最後的目標是把這些零散的功能都統合起來,讓 root_agent 真的能成為一個「多功能智慧助理」。
到這裡,我算是完成了第一階段的學習與實驗。雖然還沒有達到「超強萬能 Agent」的程度,但每一步都在往那個方向靠近。
現在工具箱裡的零件都備好了 —— Spotify、HackMD、SearXNG 這些 MCP Server 都能正常運作,就差把它們真正整合起來了!
下一篇我們就要進入重頭戲,把所有功能串成一個完整的多功能 Agent 系統,看看這個「Agent P」到底能有多厲害~
我們下一篇見(✿◡‿◡)