iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

multimodal相關文章

共有 6 則文章

0 人追蹤

追蹤

鐵人賽 AI/ ML & Data DAY 18

30 Days of AI Research 系列第 19 篇

Paper link | Note link | Code link | EMNLP 2023 整體想法這項研究對多個大型視覺語言模型（LVLMs）進行了...

whoami ‧ 2024-08-18

鐵人賽 AI/ ML & Data DAY 20

30 Days of AI Research 系列第 21 篇

Paper link | Note link | Code link | NeurIPS 2023 整體想法這項研究展示了視覺指令調整的有效性。他們引入...

whoami ‧ 2024-08-20

鐵人賽 AI/ ML & Data DAY 22

30 Days of AI Research 系列第 23 篇

Paper link | Note link | Code link | ICML 2023 整體想法這篇研究嘗試通過整合包括圖像在內的多模態資訊來開發一...

whoami ‧ 2024-08-22

鐵人賽 AI/ ML & Data DAY 17

30 Days of AI Research 系列第 18 篇

Paper link | Code link | CVPR 2022 整體想法這篇論文介紹了一項名為音頻-視覺問答（AVQA）的新任務。他們建立了一...

whoami ‧ 2024-08-17

鐵人賽 AI/ ML & Data DAY 16

30 Days of AI Research 系列第 17 篇

Paper link | ICML 2023 整體想法這項研究提出了一種簡單但有效的表示學習方法，稱為 RLEG，由基於擴散的嵌入生成器指導。擴散模型在...

whoami ‧ 2024-08-16

鐵人賽 AI/ ML & Data DAY 21

30 Days of AI Research 系列第 22 篇

Paper link | Code link | ICML 2023 整體想法這項研究採用了人機互動的解釋方法來處理多模態 Transformers 模型...

whoami ‧ 2024-08-21