iT邦幫忙

鐵人檔案

2023 iThome 鐵人賽
回列表
AI & Data

ㄟ唉廚房交響樂 多智能的煮飯秀 系列

AI現已經融入我們的生活周遭,像是Chat-GPT、推薦系統... 隨著時間的推移,模型發展的越來越龐大、複雜,為了符合實際應用,各種串接與部屬,讓演算法系統可以完整的執行一整條服務。
為了讓智能體可以更有效率的完成眼前龐大且複雜的任務,強化學習有一個分支為多智能體(Multi-agents)除了像是智慧工廠、或是足球比賽,已經在某些實驗上展現出驚人的結果,像是Open-AI的Hide and Seek 相信未來合作與競爭的模型會越來越成熟。希望可以藉由這系列的文章,讓更多人了解與認識這一塊。

鐵人鍊成 | 共 30 篇文章 | 1 人訂閱 訂閱系列文 RSS系列文
DAY 1

Day 1 多智能體系列 介紹

大家許久不見皮卡皮卡!從2019年的強化學習小恐龍系列已經過了四年,很久沒參與鐵人的競賽,但因為忙於工作還有考試關係,想參與一直沒機會,But 近期,有些空閒時...

2023-09-15 ‧ 由 皮卡喵 分享
DAY 2

Day2 強化學習簡介

強化學習的本質就是靠獎勵,不斷刺激網路,使得智能體選擇可以取得最大獎勵的動作輸出。很重要在講三次。強化學習的本質就是靠獎勵 x 3 互動模式 用簡單的圖片來...

2023-09-16 ‧ 由 皮卡喵 分享
DAY 3

Day3 Reinforce part-1

這個章節我們就來介紹 Reinforcement,另外一個大名鼎鼎的Q-function,歡迎大家迎駕到數年前的文章觀看 → Day17~Day22 Reinf...

2023-09-17 ‧ 由 皮卡喵 分享
DAY 4

Day4 Reinforce part-2

上一章節我們講完 policy 的設計,這一章節我們來看更新方法 def select_action(state): state = torch.fro...

2023-09-18 ‧ 由 皮卡喵 分享
DAY 5

Day5 Multi-agent cooperate & competitive and challenge

多智能體應用場景有很多,智慧工廠、無人機機群、物聯網汽車以及自動交易機器人… 很多舉例不完,我們先從他們的關係去了解幾個種類 智能體間關係 主要有三種,合作型、...

2023-09-19 ‧ 由 皮卡喵 分享
DAY 6

Day6 Multi-agent architecture

這個章節就來介紹三種訓練與執行的架構,闡述其差異性與優缺點 架構分類 主要分三種,去中心化、中心化、中心化訓練與去中心化執行 Fully decentral...

2023-09-20 ‧ 由 皮卡喵 分享
DAY 7

Day7 gymnasium

在過去強化學習的專案裡面,如何制定一個環境與演算法的界面,是一個很重要的事情,也因為這種概念的普及,規範化後的邏輯應用,才能讓相同性質的應用能更好拓展與快速上手...

2023-09-21 ‧ 由 皮卡喵 分享
DAY 8

Day8 多智能體框架 pettingzoo

接下來我們將介紹 pettingzoo 這個多智能體的環境。在跟單智能體相比, multi-agents 如何交互、決定順序、以及動態如何增加或遞減智能體,在工...

2023-09-22 ‧ 由 皮卡喵 分享
DAY 9

Day9 AI 社區 簡介

今天分享這篇給大家,AI社區關於模擬的研究,這是2023年四月剛出,離這個時間算蠻新的,主要是一篇關於如何讓智能體藉由互動與交互,產生出具體行為與行動的研究。其...

2023-09-23 ‧ 由 皮卡喵 分享
DAY 10

Day10 AI 社區 Let’s throw a party!

在這篇22頁的論文裡,我想做令人興奮的地方應該就是,不用透過太繁雜設定,只要賦予人格與足夠的資訊,可以讓agents們自己產生傳播訊息、產生社會行為,單純只透過...

2023-09-24 ‧ 由 皮卡喵 分享