您的位置:首頁>科技>正文

穀歌DeepMind繼AlphaGo之後,準備用AI挑戰遊戲《星際爭霸》

Oriol Vinyals曾是1990年代西班牙《星際爭霸》全國冠軍。 在他看來, 這款科幻策略遊戲讓他在生活中擁有了更強的戰略思維。 不可否認, Vinyals的戰略思維也獲得了回報:在巴塞羅完成電信工程和數學的學習後, 他去過微軟研究院實習, 而後獲得了加州大學伯克利的電腦博士學位, 接著又加入了穀歌大腦團隊, 從事人工智慧開發工作, 不久又轉到穀歌旗下的DeepMind團隊。

如今, 他再次跟《星際爭霸》打起了交道。 但這一次他不是玩家, 而是要教機器人怎麼玩這個遊戲, 也就是說, 在人工智慧成為全球最優秀的圍棋選手後, 星際成為了它下一個要攻克目標。

DeepMind與《星際爭霸》的開發商暴雪展開合作, 讓人工智慧研究人員從以往數百萬次對戰中進行學習。 他們的目標之一, 就是開發一套可以擊敗人類的人工智慧系統, 就像曾打敗了圍棋世界冠軍李世乭和柯潔的AlphaGo。 而最終的目標是將這一技術應用于現實世界,

而不僅僅停留在遊戲層面。

暴雪首席軟體工程師Jacob Repp表示:“我們正試圖理解人類大腦的工作方式。 如果我們能得到這種高品質的資料流程-——人類玩兒遊戲時的原始輸入及其結果 ——這對行為研究的人來說是非常有用的資料。

《星際爭霸2》對人工智慧研究人員來說是個有趣的挑戰。 與國際象棋或圍棋不同, 星際玩家的資訊並不完美。 這種“戰爭迷霧”意味著玩家(真實的或虛擬的)必須制定計劃, 做出決定, 或者對那些只會在幾分鐘後才能產生後果的行為作出回應。 正如DeepMind的研究人員所說, 其結果“在時間信用分配和探索上將面臨大量挑戰”。

暴雪已經使用神經網路來評估玩家技能, 而其依據是他們鍵盤和滑鼠的輸入資訊、排兵佈陣的方法以及玩遊戲的效率等, 這些信號可以讓遊戲更加有趣, 或者讓對戰雙方更加均衡。

但是, 想要讓人工智慧玩《星際爭霸2》, 就必須讓他們“看到”遊戲中的3D地圖, 並快速準確地對其進行解讀。

DeepMind的首次測試, 涉及到神經網路和人工智慧的訓練, 之後再將其應用投入到遊戲中。 即便沒有進一步的指令, 人工智慧也可以隨意在地圖上走動、移動鏡頭甚至排兵佈陣。

在加入DeepMind之前, Vinyals曾開發圖片搜索功能和Gmail的“智慧回復”功能。 該團隊還致力於語音辨識, 讓人工智慧記住不同人的說話方式,

從而完成在再次遇到該聲音時, 可以完成識別。

“在《星際爭霸2》中, 這也是需要解決的問題。 ”Vinyals說。 對人工智慧來說, 記住他們遇到的東西, 同時理解行為意義, 就需要使用LSTM神經網路。 “電腦可以把某個資料的記憶保留數十年的時間, 但現在, 這種記憶不僅需要保存, 在未來需要之時還能完成資訊調取。 ”

當然現在星際人工智慧的研究,還處於早期的階段。最近在首爾的一場競賽中,《星際爭霸》職業玩家宋炳具用了不到半小時就擊敗了4個人工智慧機器人。但他也表示,機器人的防守打法“有時候讓人震驚”。

雖然過去20年Vinyals玩《星際爭霸》機會並不多,但這位前西班牙冠軍卻對自己的《星際爭霸》技術滿懷信心。

當然現在星際人工智慧的研究,還處於早期的階段。最近在首爾的一場競賽中,《星際爭霸》職業玩家宋炳具用了不到半小時就擊敗了4個人工智慧機器人。但他也表示,機器人的防守打法“有時候讓人震驚”。

雖然過去20年Vinyals玩《星際爭霸》機會並不多,但這位前西班牙冠軍卻對自己的《星際爭霸》技術滿懷信心。

Next Article
喜欢就按个赞吧!!!
点击关闭提示