ㄟ唉廚房交響樂多智能的煮飯秀 :: 2023 iThome 鐵人賽

皮卡喵 (hung10701)

iT邦新手 4 級 ‧ 點數 322

皮卡丘

12585

累計瀏覽數

站內簡訊追蹤

鐵人檔案

2023 iThome 鐵人賽

回列表

AI & Data

ㄟ唉廚房交響樂多智能的煮飯秀系列

AI現已經融入我們的生活周遭，像是Chat-GPT、推薦系統... 隨著時間的推移，模型發展的越來越龐大、複雜，為了符合實際應用，各種串接與部屬，讓演算法系統可以完整的執行一整條服務。
為了讓智能體可以更有效率的完成眼前龐大且複雜的任務，強化學習有一個分支為多智能體(Multi-agents)除了像是智慧工廠、或是足球比賽，已經在某些實驗上展現出驚人的結果，像是Open-AI的Hide and Seek 相信未來合作與競爭的模型會越來越成熟。希望可以藉由這系列的文章，讓更多人了解與認識這一塊。

鐵人鍊成｜共 30 篇文章｜ 1 人訂閱訂閱系列文 RSS系列文

0 Like 0 留言 343 瀏覽

DAY 1

Day 1 多智能體系列介紹

大家許久不見皮卡皮卡！從2019年的強化學習小恐龍系列已經過了四年，很久沒參與鐵人的競賽，但因為忙於工作還有考試關係，想參與一直沒機會，But 近期，有些空閒時...

2023-09-15 ‧ 由皮卡喵分享

0 Like 0 留言 239 瀏覽

DAY 2

Day2 強化學習簡介

強化學習的本質就是靠獎勵，不斷刺激網路，使得智能體選擇可以取得最大獎勵的動作輸出。很重要在講三次。強化學習的本質就是靠獎勵 x 3 互動模式用簡單的圖片來...

2023-09-16 ‧ 由皮卡喵分享

0 Like 0 留言 282 瀏覽

DAY 3

Day3 Reinforce part-1

這個章節我們就來介紹 Reinforcement，另外一個大名鼎鼎的Q-function，歡迎大家迎駕到數年前的文章觀看 → Day17~Day22 Reinf...

2023-09-17 ‧ 由皮卡喵分享

0 Like 0 留言 270 瀏覽

DAY 4

Day4 Reinforce part-2

上一章節我們講完 policy 的設計，這一章節我們來看更新方法 def select_action(state): state = torch.fro...

2023-09-18 ‧ 由皮卡喵分享

0 Like 0 留言 325 瀏覽

DAY 5

Day5 Multi-agent cooperate & competitive and challenge

多智能體應用場景有很多，智慧工廠、無人機機群、物聯網汽車以及自動交易機器人… 很多舉例不完，我們先從他們的關係去了解幾個種類智能體間關係主要有三種，合作型、...

2023-09-19 ‧ 由皮卡喵分享

0 Like 0 留言 359 瀏覽

DAY 6

Day6 Multi-agent architecture

這個章節就來介紹三種訓練與執行的架構，闡述其差異性與優缺點架構分類主要分三種，去中心化、中心化、中心化訓練與去中心化執行 Fully decentral...

2023-09-20 ‧ 由皮卡喵分享

0 Like 0 留言 556 瀏覽

DAY 7

Day7 gymnasium

在過去強化學習的專案裡面，如何制定一個環境與演算法的界面，是一個很重要的事情，也因為這種概念的普及，規範化後的邏輯應用，才能讓相同性質的應用能更好拓展與快速上手...

2023-09-21 ‧ 由皮卡喵分享

0 Like 0 留言 545 瀏覽

DAY 8

Day8 多智能體框架 pettingzoo

接下來我們將介紹 pettingzoo 這個多智能體的環境。在跟單智能體相比， multi-agents 如何交互、決定順序、以及動態如何增加或遞減智能體，在工...

2023-09-22 ‧ 由皮卡喵分享

0 Like 0 留言 322 瀏覽

DAY 9

Day9 AI 社區簡介

今天分享這篇給大家，AI社區關於模擬的研究，這是2023年四月剛出，離這個時間算蠻新的，主要是一篇關於如何讓智能體藉由互動與交互，產生出具體行為與行動的研究。其...

2023-09-23 ‧ 由皮卡喵分享

0 Like 0 留言 271 瀏覽

DAY 10

Day10 AI 社區 Let’s throw a party!

在這篇22頁的論文裡，我想做令人興奮的地方應該就是，不用透過太繁雜設定，只要賦予人格與足夠的資訊，可以讓agents們自己產生傳播訊息、產生社會行為，單純只透過...

2023-09-24 ‧ 由皮卡喵分享

皮卡喵的鐵人檔案

皮卡喵的收藏

皮卡喵的追蹤

皮卡喵的Like

皮卡喵的紀錄

皮卡喵的訂閱列表