iT邦幫忙

鐵人檔案

2023 iThome 鐵人賽
回列表
AI & Data

ㄟ唉廚房交響樂 多智能的煮飯秀 系列

AI現已經融入我們的生活周遭,像是Chat-GPT、推薦系統... 隨著時間的推移,模型發展的越來越龐大、複雜,為了符合實際應用,各種串接與部屬,讓演算法系統可以完整的執行一整條服務。
為了讓智能體可以更有效率的完成眼前龐大且複雜的任務,強化學習有一個分支為多智能體(Multi-agents)除了像是智慧工廠、或是足球比賽,已經在某些實驗上展現出驚人的結果,像是Open-AI的Hide and Seek 相信未來合作與競爭的模型會越來越成熟。希望可以藉由這系列的文章,讓更多人了解與認識這一塊。

鐵人鍊成 | 共 30 篇文章 | 1 人訂閱 訂閱系列文 RSS系列文
DAY 21

Day21 Too_many_cooks gym_cooking

上個章節大概的講了概念與心智能論,這個章節會講一下這個環境 gym_cooking 的挑戰 Overcooked 如果有玩過這款遊戲 overcooked的人,...

2023-10-05 ‧ 由 皮卡喵 分享
DAY 22

Day22 Too_many_cooks hierarchical planning and contributions

在 cooking_gym 裡面,任務的完成不會只由單一個動作完成,而是由好幾個動作建構,對的順序而構成任務達成(送出生菜沙拉) Hierarchical pl...

2023-10-06 ‧ 由 皮卡喵 分享
DAY 23

Day23 Too_many_cooks MMDP

在這篇中,我們將會提到與以往MDP不一樣的地方,以及cooking_gym額外的一些設定 Multi-Agent MDPs with Sub-Task MMDP...

2023-10-07 ‧ 由 皮卡喵 分享
DAY 24

Day24 Too_many_cooks Bayesian Delegation

經過這麼多篇,終於來到我們的核心演算法,Bayesian Delegation了!不用藉由通訊,即可猜測其他智能體的意圖,當然普通的類神經網路也能作到,但 Ba...

2023-10-08 ‧ 由 皮卡喵 分享
DAY 25

Day25 Too_many_cooks Results

終於把概念跟方法講完了!這個章節我們就來看一下模型的表現有多好,該實驗主要用三個面向去表示模型的能力,除了第一種self-play,讓相同模型測試外,還有不同模...

2023-10-09 ‧ 由 皮卡喵 分享
DAY 26

Day26 Too_many_cooks 飯飯煮起來!

看到這一篇的讀者辛苦拉,到了這邊,我們終於到了可以實做跑程式的地方了,基本上就是帶著大家跑一遍訓練,可以手動讓自己玩一下,但是 agent 不會動,或許程式這邊...

2023-10-10 ‧ 由 皮卡喵 分享
DAY 27

Day27 MADDPG

今天我們要來介紹OpenAI在2017發表多智能體的經典之作 Multi-Agent Actor-Critic for Mixed Cooperative-Co...

2023-10-11 ‧ 由 皮卡喵 分享
DAY 28

Day28 MADDPG multiagent-particle-envs

介紹完MADDPG,我們接著會實做些使用MADDPG的遊戲,如果之前在PettingZoo的章節看介紹的話,會發現裡面有很多經典的例子,或是有些人用多智能體做機...

2023-10-12 ‧ 由 皮卡喵 分享
DAY 29

Day29 MADDPG run maddpg

最後倒數第二篇了,真的是感嘆萬千,前面介紹完了MADDPG與環境,這一章最後來跑實做 maddpg 這個也是OpenAI的一個專案,雖然用的是tensorflo...

2023-10-13 ‧ 由 皮卡喵 分享
DAY 30

Day30 The end

The end 坦白講,跟上一個系列來講,這個系列講了很多研究的部份,一般來講ithome應該都是篇技術,也有人偏理論或數學,但我覺得無論如何,都有達到自己的兩...

2023-10-14 ‧ 由 皮卡喵 分享