iT邦幫忙

鐵人檔案

2024 iThome 鐵人賽
回列表
AI/ ML & Data

30 Days of AI Research 系列

主要速讀 Retrieval / RL / Multi-modal / Graph 類型 paper

鐵人鍊成 | 共 31 篇文章 | 9 人訂閱 訂閱系列文 RSS系列文
DAY 10

[Day 10] Pre-Trained Language Models for Interactive Decision-Making

Paper link | Note link | Code link | NeurIPS 2022 整體想法 這項研究旨在使用語言模型作為代理,以預測強化學...

2024-08-10 ‧ 由 whoami 分享
DAY 11

[Day 11] Guiding Pretraining in Reinforcement Learning with Large Language Models

Paper link | Note link | Code link | ICML 2023 整體想法 本文提出了 ELLM 方法,該方法使用大型語言模型根...

2024-08-11 ‧ 由 whoami 分享
DAY 12

[Day 12] Building Persona Consistent Dialogue Agents with Offline Reinforcement Learning

Paper link | Code link | EMNLP 2023 整體想法 本研究使用離線強化學習來提高開放式領域對話系統的質量和效用。 摘要 在開放...

2024-08-12 ‧ 由 whoami 分享
DAY 13

[Day 13] TRAVEL: Tag-Aware Conversational FAQ Retrieval via Reinforcement Learning

Paper link | EMNLP 2023 整體想法 本研究使用強化學習 (RL) 並識別相關和不相關的標籤,以改進檢索常見問題 (FAQ) 的過程。...

2024-08-13 ‧ 由 whoami 分享
DAY 14

[Day 14] Unveiling Fantastic Fact-Skeleton of LLMs via Ontology-Driven Reinforcement Learning

Paper link | Code link | AAAI 2024 整體想法 這項研究解決了與大型語言模型(LLMs)事實性評估相關的主要挑戰,並透過複雜...

2024-08-14 ‧ 由 whoami 分享
DAY 15

[Day 15] ESRL: Efficient Sampling-Based Reinforcement Learning for Sequence Generation

Paper link | Code link | AAAI 2024 整體想法 增強式學習(Reinforcement Learning,RL)在序列生成模...

2024-08-15 ‧ 由 whoami 分享
DAY 16

[Day 16] RLEG: Vision-Language Representation Learning with Diffusion-based Embedding Generation

Paper link | ICML 2023 整體想法 這項研究提出了一種簡單但有效的表示學習方法,稱為 RLEG,由基於擴散的嵌入生成器指導。 擴散模型在...

2024-08-16 ‧ 由 whoami 分享
DAY 17

[Day 17] Learning to Answer Questions in Dynamic Audio-Visual Scenarios

Paper link | Code link | CVPR 2022 整體想法 這篇論文介紹了一項名為 音頻-視覺問答(AVQA) 的新任務。 他們建立了一...

2024-08-17 ‧ 由 whoami 分享
DAY 18

[Day 18] Evaluating Object Hallucination in Large Vision-Language Models

Paper link | Note link | Code link | EMNLP 2023 整體想法 這項研究對多個大型視覺語言模型(LVLMs)進行了...

2024-08-18 ‧ 由 whoami 分享
DAY 19

[Day 19] Compressing and Debiasing Vision-Language Pre-Trained Models for Visual Question Answering

Paper link | Code link | EMNLP 2023 整體想法 這項研究首次聯合探討了視覺語言預訓練模型(VLP)在視覺問答(VQA)任務...

2024-08-19 ‧ 由 whoami 分享