iT邦幫忙

鐵人檔案

2024 iThome 鐵人賽
回列表
佛心分享-SideProject30

DeltaPathogen:國產雙人不對稱抽象棋「疫途」之桌遊 AI 實戰 系列

Google/DeepMind 團隊在 2016 以 AlphaGo 風光擊敗世界棋王李世石,
之後,該團隊更進一步提出 AlphaZero 演算法,號稱完全擺脫人類的知識,由白板一塊(拉丁文 tabula rasa)的狀態開始自我對弈,即可逐漸進步,天下無敵。

疫情趨緩之後的 2022 年,深顏色工作室推出的桌遊「疫途」,也是抽象雙人棋。如果 AlphaZero 演算法通用到可以攻略經典遊戲,那麼對於這個數千年後的新遊戲,又如何呢?

這個系列文即是為了回應這個問題、以及其後產生的所有問題而生。「佛心」不敢當,但可視作是帶有部份資訊科技描述的遊記。

參賽天數 26 天 | 共 26 篇文章 | 7 人訂閱 訂閱系列文 RSS系列文 團隊晶心壯士III: ALcHemist
DAY 11

導入單元測試

我也只能根據自己能力所及,一件一件地...慢慢前進而已。 -- <三月的獅子(10)> ,羽海野千花繪,晴海譯 如果有興趣更有系統的學習這個部...

2024-09-11 ‧ 由 高魁良 分享
DAY 12

強化學習/AlphaZero 演算法介紹

沒過多久局面倒轉,電腦開始讓子給人類對手。我也曾好奇地挑戰了電腦幾次,但每次都比不到一半便敗跡畢露。明知沒有辦法,還是被激怒了...... -- <突圍...

2024-09-12 ‧ 由 高魁良 分享
DAY 13

對偶網路實作

「我過了這麼多年也沒有聽到你說半句話。等聽到了,第一句話你就說,你才是真正的我。那你為什麼不早點宣佈這重大的消息?」「這些年來我一直在這裡,可是,這是你第一次...

2024-09-13 ‧ 由 高魁良 分享
DAY 14

導入蒙地卡羅樹搜尋之 1

今天的內容會根據主要參考書的第六章篇幅來展開。 深度強化學習的蒙地卡羅樹搜尋演算法,有以下幾步: 初始化步驟:以當前的盤面作為根節點 根據探索(explore...

2024-09-14 ‧ 由 高魁良 分享
DAY 15

導入蒙地卡羅樹搜尋 2/3

讀書不用多,作詩不須工。海邊無事日日醉,夢魂不到蓬萊宮。 -- <送劉攽倅海陵>,蘇軾詩。 昨天看過整個概念之後,再來是如何導入的問題。我認為最...

2024-09-15 ‧ 由 高魁良 分享
DAY 16

導入蒙地卡羅樹搜尋 3/3

即使疼痛也要盡力觀察,不,愈是疼痛愈要敏銳觀察。失誤不是偶然的,出現失誤是因為我心裡有輕率和不成熟。如果不承認、改正錯誤,就會永遠像孩子般不成熟地活著。 --...

2024-09-16 ‧ 由 高魁良 分享
DAY 17

模擬--訓練的工作流程

「...我帶著山羊在山上時,想著這點,白晝似乎永無止境,但在夜幕降臨前,時間又像靜止不動,然後又是早晨......我領會羊的智慧。...」 -- <地海...

2024-09-17 ‧ 由 高魁良 分享
DAY 18

殘局譜生成器

「我並不認為自己強大,而是還相當的不成熟。大概是可以快速轉換心情吧,但技術上沒有特別優於他人。就算下出了惡手,下了就下下去了、沒有辦法。總之就是思考當時的局面...

2024-09-18 ‧ 由 高魁良 分享
DAY 19

導入網頁互動元素 1/2

今且有言於此,不知其與是類乎?其與是不類乎? -- <莊子> 在這個 patch,時值正要開賽的八月底(8/25,是 gen6、gen7 世代的...

2024-09-19 ‧ 由 高魁良 分享
DAY 20

互動元素的導入 2/2

別的先不說,但一定要記住當天下的棋。只有做到這一點,才能反省並改正。 -- <突圍思考>,曹薰鉉著,盧鴻金譯。 昨天展示了與 ChatGPT 互...

2024-09-20 ‧ 由 高魁良 分享