iT邦幫忙

2024 iThome 鐵人賽

DAY 6
0
AI/ ML & Data

30 Days of AI Research系列 第 6

[Day 6] Recitation-Augmented Language Models

  • 分享至 

  • xImage
  •  

Paper link | Note link | Code link | ICLR 2024

整體想法

這項研究使用背誦相關段落來解決知識密集型任務。

然而,我認為在「基於段落提示的多樣化背誦」部分,他們仍然依賴外部資料庫,如維基百科,來檢索知識(提示),這有助於通過提供更好的上下文和準確性來提高性能。

摘要

與大多數檢索方法在生成輸出之前嘗試檢索相關文檔不同,本研究「RECITation-augmented gEneration (RECITE)」從LLM自身的記憶中取樣一個或多個相關段落並背誦它們。

image

背景

像我們之前討論的工作一樣,最近的大型語言模型依賴外部資料庫並使用檢索增強來解決知識密集型任務。

本研究探索了另一種方法:少量示例提示(few-shot prompting)

在特定任務的自然語言處理(NLP)中,少量示例提示可以幫助大型語言模型(LLMs)表現得更好。

方法

這篇論文的目標是模仿人類在回答知識密集型問題之前背誦相關事實知識的能力,以實現更準確的答案。

這種方法有兩個組件:

  1. 一個證據背誦模塊,用於背誦相關段落。
  2. 一個問題回答模塊,用於根據背誦的證據生成答案。

而他們如何實現這個方法?

Prompt-based Recite-and-Answer for Question Answering

他們通過以下步驟來實現這種方法:

  1. 提示設計:他們將背誦的段落附加在原始問題-答案示例的開頭,形成一個單一的提示,然後生成最終的答案。

  2. 多路徑解碼技術:由於事實知識可能出現在多個地方,他們使用多路徑解碼技術。對於任意問題,他們使用 top-https://ithelp.ithome.com.tw/upload/images/20240806/20152821CfWRWk5gUi.png 采樣獨立生成幾個背誦,然後根據這些背誦貪婪地解碼問題的答案。

  3. 選擇最佳答案:通過對生成的答案進行多數投票來選擇最佳答案。

此外,他們將這種方法應用於多跳問題(multi-hop questions),通過使用 top-https://ithelp.ithome.com.tw/upload/images/20240806/20152821CfWRWk5gUi.png 采樣生成多個背誦,然後進行多數投票來確定最終答案。

Passage Hint-Based Diversified Recitation with Fine-Tuning

在這一部分,他們的目標是讓證據背誦模塊達到以下兩個目的:

  1. 避免生成具有錯誤事實的背誦。
  2. 確保采樣的背誦具有足夠的多樣性。

他們為每個段落找到獨特的提示,通過將段落的章節標題和段落內的順序進行拼接來實現。

這些段落的來源是結構良好的文本知識庫,如維基百科。

受到 多段檢索的問題回答 啟發,本研究使用聚合的多樣化背誦作為單一上下文,並通過少量示例問題-答案對來生成答案。

image

在訓練過程中,他們進行了額外的微調階段,以使大型語言模型(LLMs)學習從問題到段落提示,進而到完整段落的映射,僅通過少量示例提示。

image

訓練細節:

  1. 他們使用真實證據和問題對作為提示。
  2. 他們通過上下文學習生成新的問題,這些問題來自隨機采樣的維基百科頁面。
  3. 基於這些少量示例生成的問題,他們訓練LLM預測原始段落提示和段落內容。

實驗

資料集

本研究在三個不同的問題回答資料集上進行實驗:

  1. TriviaQA
  2. HotpotQA
  3. Natural Questions

評估指標

  1. 精確匹配(Exact Matching, EM):衡量答案與真實答案完全匹配的百分比。
  2. F1 分數:衡量精確率和召回率的調和平均值,以評估答案的正確性。

基本模型

  1. PaLM
  2. UL2
  3. OPT
  4. Codex

以下是不同資料集上的性能比較:

image

本研究還比較了 PaLM-62B 在 Natural Questions (NQ) 資料集上的不同提示策略的性能:

image


上一篇
[Day 5] Recommender Systems with Generative Retrieval
下一篇
[Day 7] Benchmarking Large Language Models in Retrieval-Augmented Generation
系列文
30 Days of AI Research31
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言