Paper link | Note link | Code link | NeurIPS 2022 整體想法 這項研究旨在使用語言模型作為代理,以預測強化學...
Paper link | Note link | Code link | ICML 2023 整體想法 本文提出了 ELLM 方法,該方法使用大型語言模型根...
Paper link | Code link | EMNLP 2023 整體想法 本研究使用離線強化學習來提高開放式領域對話系統的質量和效用。 摘要 在開放...
Paper link | EMNLP 2023 整體想法 本研究使用強化學習 (RL) 並識別相關和不相關的標籤,以改進檢索常見問題 (FAQ) 的過程。...
Paper link | Code link | AAAI 2024 整體想法 這項研究解決了與大型語言模型(LLMs)事實性評估相關的主要挑戰,並透過複雜...
Paper link | Code link | AAAI 2024 整體想法 增強式學習(Reinforcement Learning,RL)在序列生成模...
Paper link | ICML 2023 整體想法 這項研究提出了一種簡單但有效的表示學習方法,稱為 RLEG,由基於擴散的嵌入生成器指導。 擴散模型在...
Paper link | Code link | CVPR 2022 整體想法 這篇論文介紹了一項名為 音頻-視覺問答(AVQA) 的新任務。 他們建立了一...
Paper link | Note link | Code link | EMNLP 2023 整體想法 這項研究對多個大型視覺語言模型(LVLMs)進行了...
Paper link | Code link | EMNLP 2023 整體想法 這項研究首次聯合探討了視覺語言預訓練模型(VLP)在視覺問答(VQA)任務...