iT邦幫忙

2024 iThome 鐵人賽

DAY 18
0
AI/ ML & Data

軟體工程師的脫魯日誌-持續介紹hardcore AI研究直到脫魯🥹系列 第 18

Day18: MINDACT-可以幫你上網訂票和發廢文的終極Chatbot

  • 分享至 

  • xImage
  •  

最近Threads上出現一堆電子乞丐和風向文,讓人看了實在很躁。

或許有人會嗆:「不爽就不要看!」但人是犯賤的生物,你們會PO帳單條碼,我們就想臭。

我不禁思考一個問題:有沒有辦法讓AI成為一介網軍,知道如何上網發文,並且屏蔽掉自己不喜歡的文章,而且不透過selenium等自動化工具呢?

俄亥俄州立大學(OSU) 就提出了名為MINDACT的通用代理,
來讓AI透過一句話(Prompt)使用瀏覽器來訂機票、刷推特或購買iPhone等複雜的任務。

找到 Elon Musk 的推特,並開始關注、查看通知並按讚最新的推文。

預訂7月1日從孟買往返倫敦及7月5日從倫敦往返孟買的雙人成人機票

MINDACT首先使用一個小型語言模型(如:BERT) 來篩選候選元素,也就是根據Prompt來選擇網頁中的元素(連結、圖片、按鈕或輸入框…等)。
https://ithelp.ithome.com.tw/upload/images/20240927/20169030qPeFoHiHzo.png

接下來,使用大型語言模型 (LLM) 從這些候選元素中選擇最合適的元素並預測相應的操作。
https://ithelp.ithome.com.tw/upload/images/20240927/201690308OUYWKDy6c.png

這個過程將元素選擇轉化為多選問題,並讓 LLM 生成操作。

為了訓練MINDACT,他們也提出了MIND2WEB資料集,蒐集了137個網站,並建立超過2,000個任務,涉及31個不同的領域(社群媒體、餐廳、售票系統、醫院掛號系統…等等)。

Ref.
NeurIPS 2023-Mind2Web: Towards a Generalist Agent for the Web
Offical site


上一篇
Day17: TOD版的DialoGPT-ConvLab實作
下一篇
Day19: 任務導向之我們希望Siri可以操控手機和APP
系列文
軟體工程師的脫魯日誌-持續介紹hardcore AI研究直到脫魯🥹30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言