[Day 28] Graph Neural Prompting with Large Language Models - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2024 iThome 鐵人賽

DAY 28

0

AI/ ML & Data

30 Days of AI Research系列第 29 篇

[Day 28] Graph Neural Prompting with Large Language Models

16th鐵人賽 graph paper prompt engineering

2024-08-28 22:19:56

430 瀏覽

分享至

Paper link | Note link | Code link | AAAI 2024

整體想法

他們提出了「圖神經提示」（Graph Neural Prompting, GNP），這是一種新穎的即插即用方法，用於幫助預訓練的大型語言模型（LLMs）從知識圖譜（KGs）中學習有益的知識。

摘要

為了減少大型語言模型的局限性，現有的工作使用基於實體的知識來增強預訓練的LLMs。

例如，檢索增強生成（retrieval-augmented generation）仍然是一個未解決的問題，尤其是在知識圖譜（KGs）方面。

在這篇論文中，他們提出了圖神經提示（Graph Neural Prompting, GNP），這是一種即插即用的方法，旨在幫助預訓練的LLMs從知識圖譜中獲取有益的知識。

背景

知識圖譜（KGs）儲存了大量的事實，並作為一種系統化的知識呈現方式。

現有的方法通過設計定制的模型架構，將KGs與語言模型結合起來，以同時處理文本數據和KGs。

然而，由於語言模型的參數規模，聯合訓練模型變得具有挑戰性。

一種直接結合KGs和語言模型優勢的方法是將KG三元組輸入到LLMs中。

然而，這種方法可能會引入大量噪音，因為KGs可能包含各種無關的上下文。

那麼，我們能否從KGs中學習有益的知識，並將其整合到預訓練的LLMs中呢？

方法

他們提出了一種方法，通過檢索並編碼相關的基於實體的知識，來生成一個圖神經提示（Graph Neural Prompt）。

該提示是一個嵌入向量，可以用來向LLMs提供指導和指令。

給定一個問題，一組答案選項，以及一個可選的上下文。真實標籤是正確答案。

我們需要設計一個模型來選擇最佳選項以回答問題。此外，這篇論文使用知識圖譜來提供外部知識並幫助模型回答問題。

步驟如下：

將上下文、問題和答案選項的連接內容標記為輸入文本序列。
設計一系列提示標記，並將其附加到輸入標記上。將其作為LLM模型的輸入，以生成預測。
模型可以通過標準的最大似然損失進行下游任務適應訓練，使用教師強制和交叉熵損失。

實驗

知識圖譜與數據集

通用領域（常識推理）
生物醫學領域（生物醫學推理）

兩種設定

LLM Frozen（凍結模型參數）
LLM Tuned（調整模型參數）

基線方法

LLM-only（僅使用LLM）
硬提示（三種提示設計方法）
KG展平（KG Flattening）
一跳（OH）和兩跳（TH）（One-hop 和 Two-hop）
提示微調（軟提示）

下表顯示了在常識推理和生物醫學推理任務上的整體實驗結果。

下圖顯示了在LLM Frozen和LLM Tuned設定下的結果比較。

[Day 27] StructGPT: A General Framework for Large Language Model to Reason over Structured Data

[Day 29] Talk like a Graph: Encoding Graphs for Large Language Models

系列文

30 Days of AI Research 共 31 篇

目錄

RSS系列文訂閱系列文

10 人訂閱

完整目錄

尚未有邦友留言

立即登入留言

參賽組數

1064 組

團體組數

40 組

累計文章數

22206 篇

完賽人數

600 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js