Alphastar - 自畫像。
簡而言之
- AI Alphastar擊敗了Liquid團隊的兩名Pro Starcraft 2球員-Dario“ Tlo”Wünsch和Grzegorz“ Mana” Komincz;
- 在這兩種情況下,AI都贏得了5:0,儘管Komincz在此之後的另外一場比賽中取得了勝利。
- AI學到了14天,獲得了與那段時間200年的連續比賽相當的經驗。
Google DeepMind的開發人員報告他們的“學生” - AI Alphastar - 破壞了兩個職業星際爭霸2球員:Dario“ Tlo”Wünsch和Grzegorz“ Mana” Komincz來自Team Liquid。兩次單獨的五場比賽都玩了 - 在這兩種情況下,戰鬥以5:0的勝利結束。遊戲的條件和規則與專業遊戲的條件和規則相媲美,但只能與Protoss進行比賽。
最初,沒有什麼可以指向這樣的結果了- 觀察Alphastar玩的遊戲,Wünsch絕對堅信他將擊倒AI,儘管儘管有上述限制(Protoss並不是他最喜歡的比賽- Tlo的水平- 當他們演奏時,他是Grandmaster的排名)。然而, 當他開始比賽時,AI使用了完全不同的非常規的策略,他無法反擊。
與SC2聯賽和兩個專業人士相比,該圖表介紹了AI代理商的技能(以MMR為單位 - 匹配評級)。
Alphastar令人印象深刻的分數從何而來?神經網絡是該程序的基礎,最初了解星際爭霸2通過觀察人參加比賽的比賽。然後,AI培訓進入第二階段 - 人工智能“分裂”,開始互相玩耍。完整的比賽導致創建了使用獲得的知識的新子程序,從而進一步增加了策略的種類。每個所謂的“代理人”都獲得了相當於...連續演奏200年的經驗星際爭霸2。最後,選擇了最有效的策略中最有效的策略並將其包括在單個桌面GPU上的單個“代理”中。
戴著眼鏡的傢伙的臉 - 正如他們所說,一張照片值一千字。
有趣的是,就響應時間而言,AI並不比專業參與者更好。它的APM(每分鐘)比率約為280,根據DeepMind程序員的說法,與人類專業人士相比,結果要差得多。關於觀察給定狀態和對其做出反應之間延遲之間的統計數據看起來相似 - AI平均花費了約350毫秒。但是,人工智能與人類的決策不同,並以不同的方式看待遊戲 - AI立即觀看了整個地圖,而無需移動相機。但是,應該指出的是,該地圖仍然被戰爭的霧覆蓋。開發人員還開發了一個必須像人們一樣控制相機的版本 - 經過7天的訓練,但被法力擊敗。 (AI仍在開發中)。
最後,值得注意的是,Grzegorz Komincz所面對的AI在與TLO的戰鬥中獲得的經驗更加聰明。Mana最終設法挽救了我們的比賽的榮譽,在一場比賽中獲勝,由暴雪和DeepMind進行現場直播(下面記錄)。儘管必須承認我們的機會很苗條,但似乎仍有對人類的希望。