阿爾法狗登頂“棋王”後 AI撲克牌手殺也來了

在AlphaGo(阿爾法狗)沖進圍棋世界,瘋狂碾壓人類高手之後,人工智慧(AI)又殺入了新的領域——德州撲克。卡內基梅隆大學研發了一款名為“冷撲大師”的撲克比賽機器人。在近日于中國海南舉行的德州撲克人機大戰中,歷經五天的比賽和36000手對陣之後,“冷撲大師”最終以792,327的籌碼獲勝,贏得了29萬美元的獎金。 “冷撲大師”的對手方是名為龍之隊的人類德撲牌手。這支隊伍是由2016年世界德州撲克大賽WSOP金手鏈獲得者、前人人網副總裁杜悅領頭,組員有許朝軍、張淮、童舟、朱亞希等六位資深華人德撲牌手。這並非機器人首次贏得德撲比賽的勝利。

“冷撲大師”的前身是Libratus,這款機器人曾于1月在匹茲堡的120000手無上限德撲一對一比賽中擊敗四名頂級撲克玩家,贏得170萬籌碼,每百手勝率超過14個大盲。

去年,另一個叫作DeepStack的撲克機器人在與11名人類玩家的無限注德撲一對一對戰中,打敗了10人。這個AI機器人由阿爾伯塔大學、布拉格捷克理工大學和布拉格查理大學的電腦科學家們聯合研製。 “冷撲大師”創造者之一、卡內基梅隆大學電腦科學教授Tuomas Sandholm說:“我希望探索人工智慧在撲克以及其他應用領域裡各種不同的商業機會。 ”

“冷撲大師”與AlphaGo的異同

從技術角度來說,德撲與圍棋不同之處在於,圍棋是“完全資訊博弈”,通過觀察棋盤,就能立刻知道博弈所處的完整狀態。而德撲則是一種“不完全資訊博弈”。

和人類一樣,“冷撲大師”在翻牌前只能看到自己的牌,它必須自己算牌,根據出牌序列、對手風格、對手位置和籌碼深度等等因素來反推對手手中的牌,從而計算各自的勝率。而且,在德撲比賽中,運氣是個關鍵因素。

杜悅評價道:“冷撲大師的出牌全部基於科學的計算。而且,冷撲大師永遠理性。不能保持頭腦冷靜卻是人類選手的最大缺陷。 ”

海南人機大戰發起者、創新工廠董事長兼CEO李開複表示,和人工智慧玩德州撲克,人類代表隊預期的勝算率是10%。

正如與AlphaGo對陣的李世石所說,“人會有心理上的搖擺,即使知道準確的答案,在下子那一刻還是有可能會選擇另一條路, 考慮其他的選擇。但AlphaGo不會有任何動搖,這就是我所面對的最大困難。 ”

李世石甚至表示:“面對毫無感情的對手是非常難受的事情,這讓我有種再也不想跟它比賽的感覺。 ”他承認,如果再有機會跟AlphaGo對弈,情況一定也會非常艱難。

德撲AI技術尚未成熟

目前來看,雖然AlphaGo在圍棋界已經算得上大師級別,但能夠對弈撲克的AI技術還遠談不上成熟。

杜悅表示,必須弄清楚的是,龍之隊和冷撲大師的對戰形式是一對一,最後計算累計成績。在現實生活中,徳撲是多人遊戲,而眼下AI還玩不轉多人形式。 “跟單挑相比,多人遊戲在計算複雜度上不是一個量級的,而是指數級的增長。所以,在可預見的未來,我們應該不會看到最頂尖的機器人在多人桌上出現。 ”

但他同時還稱,人工智慧一旦能夠戰勝人類頂級玩家,就證明它的理論和模型是對的,在成熟的AI面前,“人類沒有絲毫的勝算” 。

“人工智慧的到來不可避免。人機共存時代,人類會和機器互相幫助,也會互相競爭。 ”