[Day 27] StructGPT: A General Framework for Large Language Model to Reason over Structured Data

2024 iThome 鐵人賽

DAY 27

AI/ ML & Data

30 Days of AI Research系列第 28 篇

16th鐵人賽 deep learning llm graph

whoami

2024-08-27 23:10:57

231 瀏覽

分享至

Paper link | Note link | Code link | EMNLP 2023

整體想法

本篇提出了一個通用框架，用於提升LLM在結構化數據上的零樣本推理能力。

摘要

在這篇論文中，他們旨在以統一的方式提升大型語言模型（LLMs）在結構化數據上的推理能力。

受LLM工具增強研究的啟發，他們開發了一個「迭代閱讀-然後推理」（Iterative Reading-then-Reasoning, IRR）框架，來解決基於結構化數據的問答任務，稱為 StructGPT。

背景

儘管大型語言模型（LLMs）在自然語言處理（NLP）領域取得了顯著進展，但最近的研究也揭示了LLMs可能會生成與事實知識相衝突的不實資訊，並且在掌握特定領域或實時知識方面仍然存在不足。

方法

本研究受到增強LLM能力的工具操作策略的啟發。

他們整合了專門的介面來操作結構化數據記錄。

這樣，LLMs可以專注於基於從這些介面獲得的證據進行推理。

這項工作主要集中在使用LLMs解決基於結構化數據的複雜推理任務。

實驗

他們針對結構化數據上的三個複雜推理任務進行了實驗：

KGQA（基於知識圖譜的問答）
TableQA（表格問答）
基於數據庫的文本轉SQL（text-to-SQL）

下圖顯示了不同方法在KGQA任務中的結果。

下圖顯示了不同方法在TableQA任務中的結果。

下圖顯示了不同方法在Text-to-SQL任務中的結果。

[Day 26] Graph of Thoughts: Solving Elaborate Problems with Large Language Models

[Day 28] Graph Neural Prompting with Large Language Models

系列文

30 Days of AI Research 共 31 篇

RSS系列文訂閱系列文

9 人訂閱

完整目錄

直播研討會

尚未有邦友留言

立即登入留言

參賽組數

1064 組

團體組數

40 組

累計文章數

22199 篇

完賽人數

600 人

基於LLM模型的 AI Agent 從零到進階實踐

Hello World Dev Conference |

42 分

2021 Q4 - Progress MFT 安全檔案傳輸管理軟體 - MOVEit Automation 培訓課程 (2)

EC NETWORKER |

113 分

AI 在 Microsoft Security 中的實踐與應用：資安防禦的新方向

臺灣資安大會 |

29 分

企業搜索解決方案最佳利器

IT EXPLAINED |

38 分

零信任資安大趨勢

零信任資安講堂 |

35 分

Greenplum - 開源分散式資料庫，流數據整合方案

歐立威科技 |

57 分

識別出遠距團隊的 bad smell

MWC |

34 分

F5 NGINX Modernizes App 系列一：現代應用架構的基石：NGINX的技術藍圖與未來

IT EXPLAINED |

39 分

A11y & customization

MWC |

41 分

F5 Kubernetes Networking - 多雲容器網路解決方案系列第一堂：容器整體網路架構概述

IT EXPLAINED |

57 分

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js

IT邦幫忙

30 Days of AI Research系列 第 28 篇