您的位置:首頁>正文

1分鐘知識錦囊 | 聽說開發者都喜歡用遊戲來訓練AI,為什麼?

1分鐘知識錦囊是36氪的日更問答新欄目, 旨在每天以一分鐘為限, 快問快答一個重要的商業問題。 今天我們解答的是AI相關的問題。 如果你對近期的商業世界還有什麼疑問, 歡迎給我們留言, 錦囊負責找高手為你解答。

今日錦囊答主:孫然 36氪記者

簡單說, AI開發者都喜歡用遊戲來訓練演算法, 是看中了遊戲本身可以模擬出人類現實生活中的場景, AI 在這個訓練場中能事半功倍地觀察人類的動作, 學習如何跟人類一起合作。

當初Deep Mind訓練Alpha Go下圍棋, 其實也是同樣的邏輯。 很多公司都在用遊戲訓練AI, 比如埃隆·馬斯克創立的非營利科研機構Open AI, 曾推出過一款包含《傳送門2》在內幾百個遊戲的軟體Universe。 微軟也曾試圖通過一款名為《Mine Craft》遊戲, 訓練出一款能理解和預測人類意圖的AI個人助手.。

關注度最大的遊戲是《星際爭霸Ⅱ》, 一方面因為它是Deep Mind繼圍棋之後最新的投入方向。

另一方面, 相對於圍棋棋盤19乘19的限定場景, 《星際爭霸Ⅱ》具備的場景要複雜的多, 它是所有即時戰略、奪財遊戲的始祖, 很適合作為訓練人機對抗和協作的試驗場。

在《星際爭霸Ⅱ》的場景裡, 一方面需要玩家的微操能力, 另一方面又強調宏觀決策能力, 玩家在資源有限的情況下如何平衡發展?是花資源發展高科技, 還是出兵種對抗?碰到非常聰明手速又很快的對手攻過來, 還考驗你如何運隊。

它涵蓋了人工智慧的幾個核心問題:如何在有限的視野和不完全的資訊下做決策?如何平衡短中長期的發展策略?如何處理多智慧體之間的合作和博弈。

相對於圍棋, 《星際爭霸》的場景更加開放、複雜, 也因此更貼近人類在現實生活中做決策的環境,

更具挑戰。 在其中訓練AI, 能把深度學習技術的研究再提升一個層次, 説明人工智慧開發創造基準, 推進關於決策智慧的研究。

比如當人機在遊戲中協作, 機器和我們只是共用一個螢幕視野, 但背後你是怎麼思考的, 下一步怎麼動……這些資訊機器都不能直接拿到, 需要對你建模, 預測, 在思考用什麼樣的策略配合你, 來做智慧輔助決策。

另外, 在王者榮耀、吃雞遊戲等很多產品裡, 已經可以看到一些人機對戰或者協作的玩法了。

而遊戲只是訓練AI智慧決策的開端, 日後在電商和廣告行業的個性化行銷、電力等資源的調度、甚至未來在L4、L5無人駕駛車輛中, 機器會越來越多地幫助人類做決策。

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示