今日錦囊答主:孫然 36氪記者
簡單說, AI開發者都喜歡用遊戲來訓練演算法, 是看中了遊戲本身可以模擬出人類現實生活中的場景, AI 在這個訓練場中能事半功倍地觀察人類的動作, 學習如何跟人類一起合作。
當初Deep Mind訓練Alpha Go下圍棋, 其實也是同樣的邏輯。 很多公司都在用遊戲訓練AI, 比如埃隆·馬斯克創立的非營利科研機構Open AI, 曾推出過一款包含《傳送門2》在內幾百個遊戲的軟體Universe。 微軟也曾試圖通過一款名為《Mine Craft》遊戲, 訓練出一款能理解和預測人類意圖的AI個人助手.。
關注度最大的遊戲是《星際爭霸Ⅱ》, 一方面因為它是Deep Mind繼圍棋之後最新的投入方向。
在《星際爭霸Ⅱ》的場景裡, 一方面需要玩家的微操能力, 另一方面又強調宏觀決策能力, 玩家在資源有限的情況下如何平衡發展?是花資源發展高科技, 還是出兵種對抗?碰到非常聰明手速又很快的對手攻過來, 還考驗你如何運隊。
它涵蓋了人工智慧的幾個核心問題:如何在有限的視野和不完全的資訊下做決策?如何平衡短中長期的發展策略?如何處理多智慧體之間的合作和博弈。
相對於圍棋, 《星際爭霸》的場景更加開放、複雜, 也因此更貼近人類在現實生活中做決策的環境,
比如當人機在遊戲中協作, 機器和我們只是共用一個螢幕視野, 但背後你是怎麼思考的, 下一步怎麼動……這些資訊機器都不能直接拿到, 需要對你建模, 預測, 在思考用什麼樣的策略配合你, 來做智慧輔助決策。
另外, 在王者榮耀、吃雞遊戲等很多產品裡, 已經可以看到一些人機對戰或者協作的玩法了。
而遊戲只是訓練AI智慧決策的開端, 日後在電商和廣告行業的個性化行銷、電力等資源的調度、甚至未來在L4、L5無人駕駛車輛中, 機器會越來越多地幫助人類做決策。