npm i -g @llamaindex/semtools
# Parse some files
parse my_dir/*.pdf
# Search some (text-based) files
search "some keywords" *.txt --max-distance 0.3 --n-lines 5
# Combine parsing and search
parse my_docs/*.pdf | xargs search "API endpoints"
很多 Coding Agents(像 Claude-Code、Cursor、Gemini CLI 等)不只是能自動生成程式碼,其實還能處理檔案相關的任務。這時候如果加上 semtools,就能大幅強化它們的能力:
在 CLAUDE.md
或 AGENTS.md
裡加上 semtools 的使用方式,確保 Agent 知道怎麼調用。
假設有一個資料夾放了 900+ PDF 論文,可以先用 parse 解析:
parse ./papers
接著進入 Claude Code,直接問:
幫我整理 ACL 2023 論文中關於 LLM 評估的研究發現
Claude 就會自動呼叫 parse 和 search,從所有 PDF 裡抓出相關片段,再進行總結。整個過程約 4 分鐘,花費不到一美元,就能從 900 多篇論文裡得到結論。
技術:semtools
分類:AI Agent 工具庫
難度:⭐⭐⭐☆☆(1-5顆星)
實用度:⭐⭐⭐⭐☆(1-5顆星)
一句話:把 LLM 變成可調用外部工具的 Agent,不被框架綁死。
關鍵指令:pip install semtools / cargo install semtools
適用情境:需要讓 LLM 具備查詢、運算、API 調用與文件解析等能力時。
semtools 不只是「AI function calling 的工具庫」,它更像是 LLM 的外掛商店。單用在 LangChain 或 LlamaIndex 已經很實用,但真正的威力是在結合 Coding Agents 的時候 —— 你就能把 Claude-Code 或 Cursor 當成「全能開發助理 + 文件研究員」。
接下來我想試試,把 semtools 和 公司內部文件 + 自訂 API 結合,讓 Agent 幫我查找專案知識,甚至直接幫我下指令。