在前幾天我們已經學會了如何透過 n8n 抓取 arXiv 的多篇論文,並把內容交給 Gemini 做摘要。
但當論文變多、內容變長時,就會遇到 LLM 輸入長度限制 的問題,這時候 Summarization Chain 就派上用場了。
準備資料:
分段設定 (Chunking Strategy):
選擇方法 (Summarization Method):
設定 Prompt(必須包含 {text}
):
你是一位技術編輯,請將以下內容濃縮為重點摘要(3–5 點),保留專有名詞與數據:
{text}
把arxiv API 取得的論文摘要整理好,丟到Summarization Chain
# Loop over input items and extract title, summary as dict
for item in _input.all():
data = {}
data[0] =''
for e in item.json["feed"]["entry"]:
data[0] =data[0]+ "title" + e["title"]+":"+e["summary"].strip()+"\n"
item.json = data
return _input.all()
輸出結果範例:
這邊會在短時間內大量調用API,因為是使用免費方案,在測試時常常會遇到API上限的問題,使用付費方案的話要注意一下使用量