Google/DeepMind 團隊在 2016 以 AlphaGo 風光擊敗世界棋王李世石,
之後,該團隊更進一步提出 AlphaZero 演算法,號稱完全擺脫人類的知識,由白板一塊(拉丁文 tabula rasa)的狀態開始自我對弈,即可逐漸進步,天下無敵。
疫情趨緩之後的 2022 年,深顏色工作室推出的桌遊「疫途」,也是抽象雙人棋。如果 AlphaZero 演算法通用到可以攻略經典遊戲,那麼對於這個數千年後的新遊戲,又如何呢?
這個系列文即是為了回應這個問題、以及其後產生的所有問題而生。「佛心」不敢當,但可視作是帶有部份資訊科技描述的遊記。
我也只能根據自己能力所及,一件一件地...慢慢前進而已。 -- <三月的獅子(10)> ,羽海野千花繪,晴海譯 如果有興趣更有系統的學習這個部...
沒過多久局面倒轉,電腦開始讓子給人類對手。我也曾好奇地挑戰了電腦幾次,但每次都比不到一半便敗跡畢露。明知沒有辦法,還是被激怒了...... -- <突圍...
「我過了這麼多年也沒有聽到你說半句話。等聽到了,第一句話你就說,你才是真正的我。那你為什麼不早點宣佈這重大的消息?」「這些年來我一直在這裡,可是,這是你第一次...
今天的內容會根據主要參考書的第六章篇幅來展開。 深度強化學習的蒙地卡羅樹搜尋演算法,有以下幾步: 初始化步驟:以當前的盤面作為根節點 根據探索(explore...
讀書不用多,作詩不須工。海邊無事日日醉,夢魂不到蓬萊宮。 -- <送劉攽倅海陵>,蘇軾詩。 昨天看過整個概念之後,再來是如何導入的問題。我認為最...
即使疼痛也要盡力觀察,不,愈是疼痛愈要敏銳觀察。失誤不是偶然的,出現失誤是因為我心裡有輕率和不成熟。如果不承認、改正錯誤,就會永遠像孩子般不成熟地活著。 --...
「...我帶著山羊在山上時,想著這點,白晝似乎永無止境,但在夜幕降臨前,時間又像靜止不動,然後又是早晨......我領會羊的智慧。...」 -- <地海...
「我並不認為自己強大,而是還相當的不成熟。大概是可以快速轉換心情吧,但技術上沒有特別優於他人。就算下出了惡手,下了就下下去了、沒有辦法。總之就是思考當時的局面...
今且有言於此,不知其與是類乎?其與是不類乎? -- <莊子> 在這個 patch,時值正要開賽的八月底(8/25,是 gen6、gen7 世代的...
別的先不說,但一定要記住當天下的棋。只有做到這一點,才能反省並改正。 -- <突圍思考>,曹薰鉉著,盧鴻金譯。 昨天展示了與 ChatGPT 互...