30 Days of AI Research :: 2024 iThome 鐵人賽

whoami (jacksoncsie)

iT邦研究生 4 級 ‧ 點數 1887

56137

累計瀏覽數

30人

在追蹤

站內簡訊追蹤

鐵人檔案

2024 iThome 鐵人賽

回列表

AI/ ML & Data

30 Days of AI Research 系列

主要速讀 Retrieval / RL / Multi-modal / Graph 類型 paper

鐵人鍊成｜共 31 篇文章｜ 10 人訂閱訂閱系列文 RSS系列文

0 Like 0 留言 561 瀏覽

DAY 10

[Day 10] Pre-Trained Language Models for Interactive Decision-Making

Paper link | Note link | Code link | NeurIPS 2022 整體想法這項研究旨在使用語言模型作為代理，以預測強化學...

2024-08-10 ‧ 由 whoami 分享

0 Like 0 留言 604 瀏覽

DAY 11

[Day 11] Guiding Pretraining in Reinforcement Learning with Large Language Models

Paper link | Note link | Code link | ICML 2023 整體想法本文提出了 ELLM 方法，該方法使用大型語言模型根...

2024-08-11 ‧ 由 whoami 分享

0 Like 0 留言 529 瀏覽

DAY 12

[Day 12] Building Persona Consistent Dialogue Agents with Offline Reinforcement Learning

Paper link | Code link | EMNLP 2023 整體想法本研究使用離線強化學習來提高開放式領域對話系統的質量和效用。摘要在開放...

2024-08-12 ‧ 由 whoami 分享

0 Like 0 留言 650 瀏覽

DAY 13

[Day 13] TRAVEL: Tag-Aware Conversational FAQ Retrieval via Reinforcement Learning

Paper link ｜ EMNLP 2023 整體想法本研究使用強化學習 (RL) 並識別相關和不相關的標籤，以改進檢索常見問題 (FAQ) 的過程。...

2024-08-13 ‧ 由 whoami 分享

0 Like 0 留言 759 瀏覽

DAY 14

[Day 14] Unveiling Fantastic Fact-Skeleton of LLMs via Ontology-Driven Reinforcement Learning

Paper link | Code link | AAAI 2024 整體想法這項研究解決了與大型語言模型（LLMs）事實性評估相關的主要挑戰，並透過複雜...

2024-08-14 ‧ 由 whoami 分享

0 Like 0 留言 650 瀏覽

DAY 15

[Day 15] ESRL: Efficient Sampling-Based Reinforcement Learning for Sequence Generation

Paper link | Code link | AAAI 2024 整體想法增強式學習（Reinforcement Learning，RL）在序列生成模...

2024-08-15 ‧ 由 whoami 分享

0 Like 0 留言 654 瀏覽

DAY 16

[Day 16] RLEG: Vision-Language Representation Learning with Diffusion-based Embedding Generation

Paper link | ICML 2023 整體想法這項研究提出了一種簡單但有效的表示學習方法，稱為 RLEG，由基於擴散的嵌入生成器指導。擴散模型在...

2024-08-16 ‧ 由 whoami 分享

0 Like 0 留言 769 瀏覽

DAY 17

[Day 17] Learning to Answer Questions in Dynamic Audio-Visual Scenarios

Paper link | Code link | CVPR 2022 整體想法這篇論文介紹了一項名為音頻-視覺問答（AVQA）的新任務。他們建立了一...

2024-08-17 ‧ 由 whoami 分享

0 Like 0 留言 1121 瀏覽

DAY 18

[Day 18] Evaluating Object Hallucination in Large Vision-Language Models

Paper link | Note link | Code link | EMNLP 2023 整體想法這項研究對多個大型視覺語言模型（LVLMs）進行了...

2024-08-18 ‧ 由 whoami 分享

0 Like 0 留言 762 瀏覽

DAY 19

[Day 19] Compressing and Debiasing Vision-Language Pre-Trained Models for Visual Question Answering

Paper link | Code link | EMNLP 2023 整體想法這項研究首次聯合探討了視覺語言預訓練模型（VLP）在視覺問答（VQA）任務...

2024-08-19 ‧ 由 whoami 分享

whoami的鐵人檔案

whoami的收藏

whoami的追蹤

whoami的Like

whoami的紀錄

whoami的訂閱列表

鐵人檔案

30 Days of AI Research 系列

標記使用者