1分鐘知識錦囊 | 聽說開發者都喜歡用遊戲來訓練AI，為什麼？

1分鐘知識錦囊是36氪的日更問答新欄目，旨在每天以一分鐘為限，快問快答一個重要的商業問題。今天我們解答的是AI相關的問題。如果你對近期的商業世界還有什麼疑問，歡迎給我們留言，錦囊負責找高手為你解答。

今日錦囊答主：孫然 36氪記者

簡單說， AI開發者都喜歡用遊戲來訓練演算法，是看中了遊戲本身可以模擬出人類現實生活中的場景， AI 在這個訓練場中能事半功倍地觀察人類的動作，學習如何跟人類一起合作。

當初Deep Mind訓練Alpha Go下圍棋，其實也是同樣的邏輯。很多公司都在用遊戲訓練AI，比如埃隆·馬斯克創立的非營利科研機構Open AI，曾推出過一款包含《傳送門2》在內幾百個遊戲的軟體Universe。微軟也曾試圖通過一款名為《Mine Craft》遊戲，訓練出一款能理解和預測人類意圖的AI個人助手.。

關注度最大的遊戲是《星際爭霸Ⅱ》，一方面因為它是Deep Mind繼圍棋之後最新的投入方向。

另一方面，相對於圍棋棋盤19乘19的限定場景，《星際爭霸Ⅱ》具備的場景要複雜的多，它是所有即時戰略、奪財遊戲的始祖，很適合作為訓練人機對抗和協作的試驗場。

在《星際爭霸Ⅱ》的場景裡，一方面需要玩家的微操能力，另一方面又強調宏觀決策能力，玩家在資源有限的情況下如何平衡發展？是花資源發展高科技，還是出兵種對抗？碰到非常聰明手速又很快的對手攻過來，還考驗你如何運隊。

它涵蓋了人工智慧的幾個核心問題：如何在有限的視野和不完全的資訊下做決策？如何平衡短中長期的發展策略？如何處理多智慧體之間的合作和博弈。

相對於圍棋，《星際爭霸》的場景更加開放、複雜，也因此更貼近人類在現實生活中做決策的環境，

更具挑戰。在其中訓練AI，能把深度學習技術的研究再提升一個層次，説明人工智慧開發創造基準，推進關於決策智慧的研究。

比如當人機在遊戲中協作，機器和我們只是共用一個螢幕視野，但背後你是怎麼思考的，下一步怎麼動……這些資訊機器都不能直接拿到，需要對你建模，預測，在思考用什麼樣的策略配合你，來做智慧輔助決策。

另外，在王者榮耀、吃雞遊戲等很多產品裡，已經可以看到一些人機對戰或者協作的玩法了。

而遊戲只是訓練AI智慧決策的開端，日後在電商和廣告行業的個性化行銷、電力等資源的調度、甚至未來在L4、L5無人駕駛車輛中，機器會越來越多地幫助人類做決策。