作者 lolic (白蝙蝠巴比特)
標題 [閒聊] 5萬小時訓練AI玩寶可夢紅版 走不出月見山
時間 Wed Oct 25 21:25:02 2023


https://game.udn.com/game/story/122089/7526108

在經歷長達 5 萬小時的訓練與學習後,

一位工程師成功讓一套 AI 模組學會如何遊玩《寶可夢:紅版》,

創造出能夠自行探索遊戲,組成寶可夢隊伍...。

...

由於機器演算法在本質上並不在乎「全破」一款遊戲,

因此 Whidden 為 AI 演算法設計一套在完成特定目標時能夠獲得獎勵的系統。

為了鼓勵 AI 在《寶可夢:紅版》中進行探索,

只要能夠在地圖上看到一些之前沒有看過的東西,就能夠獲得獎勵點數。

最終 AI 順利從真心鎮出發,穿過常盤森林,來到深灰市挑戰第一道館。

在那之前,AI 還需要更加完善的獎懲系統。

在學會看到新事物能夠獲得獎勵後,雖然 AI 會開始不斷向前邁進,

但完全不在乎收服寶可夢或進行對戰,而是在遇到野生寶可夢時立刻逃走。

因此,Whidden 為獎勵系統加入更多內容,


依照 AI 寶可夢隊伍的等級總和給予獎勵,讓它開始有動力去練等和捕捉寶可夢。

只不過在某一次的演算中,AI 走進寶可夢中心時意外開啟 PC,並在其中存放幾隻寶可夢。

由於 AI 獲得的獎勵點數是依照隊伍等級總和而定,這個行為導致 AI 獲得的分數瞬間驟降。


為了避免重蹈覆轍,AI 在那之後的所有演算中都選擇避開寶可夢中心,

完全不敢進去為寶可夢補血,這讓 Whidden 不得不再次插手調整。

這套 AI 演算法最基本的運作方式,其實就是隨機在《寶可夢:紅版》中走動與遊戲進行互動,

直到發現能夠以最有效率的方式獲得最多獎勵的路徑,並將經驗保留到下一次的演算中。

在挑戰的過程中,AI 都只會使用最基本的攻擊招式撞擊來進行對戰,


直到該招式的 PP 用完後才會使用其他選擇。

某次演算中,AI 終於發現傑泥龜的泡沫攻擊能夠對小剛的寶可夢造成大量的傷害,

最終順利擊敗這位道館館主。

即使 AI 在對於遊戲的理解與邏輯上依然比不上人類,但這場實驗發掘了一些更加深層的細節。

根據 Whidden 的發現,

AI 在經歷一段時間的演算後就開始固定以看似不尋常的路徑從真心鎮出發,直到遇到第一隻野生寶可夢。

然而,這一系列的操作其實能夠保證 AI 能夠一球抓到遇見第一隻寶可夢。

也就是說,AI 發現一個 Speedrun 玩家可能要花上好幾年的時間研究才有機會注意到的系統漏洞。

這套 AI 演算法在成功突破第一道館時基本上已經達成了 Whidden 最初設定的目標,

但 Whidden 決定要讓 AI 的《寶可夢:紅版》冒險繼續下去,

看看目前的獎勵機制到底能讓它走多遠。

可惜的是,第一和第二道館之間的月見山對於看到新事物就能加分的 AI 來說

實在是太過於容易分心,

因此一直到 Whidden 決定讓實驗告一段落前都無法順利抵達華藍市。

除此之外,AI 似乎非常喜歡從鯉魚王大叔手中購買鯉魚王,

因為這樣的行為能夠讓 AI 寶可夢隊伍的等級總和立刻多出五等,

因此到實驗結束前,AI 在其中 1 萬次的演算中都跑去買了鯉魚王。

另外值得注意的是,AI 有一次將抓來的小拉達命名為了「AI」,讓人細思極恐。

https://youtu.be/DcYLT37ImBY?si=Yc6mnic1FdBh3zw9

-----

1. 只要能夠在地圖上看到新東西,就能夠獲得獎勵點數

--> ai只會拼命往前衝,完全不打怪不練等

2. 依照 AI 寶可夢隊伍的等級總和給予獎勵

--> 不敢進寶可夢中心 以免把寶可夢存入電腦中、

一萬次演算都跑去買鯉魚王  因為直接加五等XD

3.月見山過多新事物 AI無法專心 中止實驗


--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.73.186.109 (臺灣)
※ 作者: lolic 2023-10-25 21:25:02
※ 文章代碼(AID): #1bEHSmrJ (C_Chat)
※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1698240304.A.D53.html
Satoman: 耶穌鳥屌打1F 10/25 21:26
xsc: 發現一發必中BUG有點恐怖2F 10/25 21:27
ianpttptt: 有台灣Yt 疑似未授權的搬運3F 10/25 21:27
ryoma1: 一群猴子>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>AI4F 10/25 21:28
BattleFries: 好酷5F 10/25 21:28
willytp97121: 看來對AI來說寶可夢暫時還太難懂了一點6F 10/25 21:28
yys310: TPP>>>>>>>AI7F 10/25 21:28
kinuhata: 鯉魚王大叔或成最大贏家8F 10/25 21:28
shampoopoo: 這意思是還不如金魚嗎9F 10/25 21:30
shadowblade: 金魚>>>AI10F 10/25 21:30
shlee: 滿酷的11F 10/25 21:30
andy0481: 結論 多了獎勵導向的硬A怪而已12F 10/25 21:30
MrSherlock: 笑死13F 10/25 21:30
killerj466v2: AI:我要皮皮!我要月見石114F 10/25 21:31
ikachann: 寶可夢其實很複雜耶 別看屬性相剋那樣 其實裡面學問超多15F 10/25 21:32
NoLimination: 獎勵應該是館主 四天王 冠軍吧
一般小孩理解的第一遊戲目標16F 10/25 21:34
lolicon: AI取AI的名字XD18F 10/25 21:34

--
作者 lolic 的最新發文:
點此顯示更多發文記錄