您的位置:首頁>遊戲>正文

德州撲克人機大戰“二番戰”:用撲克挽回人類尊嚴?

冷撲大師即將對戰“龍之隊”

今年1月, 美國卡耐基梅隆大學開發的人工智慧Libratus(冷撲大師)與4名人類頂尖德州撲克選手展開了一場“人機大戰”,

冷撲大師取得完勝。 據報導, 這場“人機大戰”在匹茲堡一家賭場中進行, 從1月11日到30日, 人工智慧與4名人類選手共玩了12萬手一對一不限注的德州撲克。 到比賽結束時, 人工智慧領先人類選手共約177萬美元籌碼。 在4名人類頂尖選手中, 輸得最少的一位也落後人工智慧約8.6萬美元籌碼……在李開複牽線搭橋下, 4月6日至10日冷撲大師將來到中國海南, 對陣由杜悅、許朝軍、張淮、童舟、朱亞希、王天健六位牌手組成的“龍之隊”。 隊長杜悅在接受採訪時苦笑著說:“龍之隊只有10%的勝算”。

之前我在一篇文章中寫到, 在圍棋和象棋這樣的“完美遊戲”中, 人工智慧可以通過深度學習和強大的計算力, 暴虐人類, 而在四國軍棋、撲克牌等具有欺騙性的遊戲中占不到便宜。

後來, 我發現我錯了。 ——也許在這類遊戲中, 電腦獲勝的概率更高, 甚至無需耗費太多的計算力。

我們認可人工智慧在圍棋、象棋領域的壓倒性優勢, 但是撲克牌、麻將、四國軍棋等遊戲, 本身具有欺詐性、偶然性、變化性, 其決定勝負的因素超出了“計算力”所覆蓋的範疇。 譬如撲克和麻將每次上手摸到的牌, 四國軍棋的佈陣, 都會增加局面的複雜性和未知性。 同時, 不像圍棋那樣完全憑“硬實力”對話, 撲克或麻將有一些以弱勝強的翻盤機會, 增加了遊戲的參與性和趣味性。

關於“欺詐性”或“詐術”, 也是這類遊戲中運用較多的部分, 這也被認為是人類獨有的特點和優勢, 目前的人工智慧還無法企及。 記得科幻小說《三體》中也提到,

儘管外星的三體人擁有大幅超越人類的科技實力, 但是在“欺騙”方面是一張白紙, 於是人類充分利用了“欺騙”的藝術, 形成“面壁計畫”與之抗衡。

延展到牌局上來看, 由於撲克和麻將具有未知性, 參與者不清楚對方手中的牌,

才會出現種種誘騙的招數, 另一方則要努力識破這些伎倆, 並且將計就計。 如果說圍棋是那些擺開陣勢、憑硬實力肉搏的對仗;撲克和麻將就是那種爾虞我詐、充斥著欺騙和謀術的戰爭。

冷撲大師的開發者Andrew Moore坦言, 冷撲大師不會詐術, 它只是採用大量數學, 根據現有的局面計算出什麼打法是最優化的, 如何產生最高的勝率。 其難點在於, 人們會使用多樣的欺詐招數, 程式必須去一一檢查, 但不一定能查得出。

如果用現在的人工智慧和人類比打仗, 應該還差了一截。 但是撲克、麻將和戰爭不同。 用強大的計算和深度學習能力, 已經可以彌補謀略上的不足。 以鬥地主為例, 兩副牌只有108張, 牌型只有單張、一對、三條、三帶二、三姐妹、炸彈等不到10種。 首先, 人工智慧拿到手牌之後, 根據歷史資料和相應計算, 可以判斷出當地主或當農民的勝率, 並在理牌時算出自己的最優出牌組合;第二, 在幾個出牌輪次之後, 人工智慧可以輕鬆計算出消耗掉多少張大小王、2、A、K、Q、J, 甚至連10以內的牌算得清清楚楚(一般人類高手能算清10以上的大牌出處就挺厲害了);第三, 越到殘局,人工智慧優勢越明顯。因為人類手上的牌越出越少,剩餘的牌型組合可能性也越來越小,對於人工智慧而言,在計算過程中可以刪除多餘的選項,選擇最優的打法。

這樣,人類獲勝的機會,只有期望拿到一手驚豔的牌(譬如很齊整的牌,全是炸彈等等),但這種概率是有限的。人們可以贏一局兩局,但是十局八局呢?最終還是輸。麻將、四國軍棋以此類推。如果再算上體力和情緒波動等劣勢,人類獲勝概率10%絕非危言聳聽。

“龍之隊”和冷撲大師這次比的德州撲克,相對于鬥地主和麻將,其實對人類還有利一些。因為它不僅比牌面和詐術,還有心理——心理戰也是人類的優勢,電視劇《勝者為王》中石志康也以此擊敗了植入電腦晶片的屠天龍。

但即便如此,這次德州撲克的人機大戰,人類方還是岌岌可危。因為德州撲克是一種賭局,人都有賭性。在形勢較好的情況下往往失去理性,在處於劣勢的情況下卻又沮喪自棄,或走極端孤注一擲;如果只以一兩把定輸贏,人類有機會劍走偏鋒而取勝;而在漫長的馬拉松牌局中,這樣的勝算被壓到最低。因為人工智慧永遠那麼冷酷無情,不受情緒左右;在牌局的演進中還會不斷學習和提升,熟悉人類選手的打法,採用精准的針對性策略……

人工智慧的時代已經來臨,即便不甘心,我們也必須學著坦然接受。畢竟我們也看到,人工智慧給人類社會帶來許多變革。但所有的前提是,它還在我們的掌控之中。

越到殘局,人工智慧優勢越明顯。因為人類手上的牌越出越少,剩餘的牌型組合可能性也越來越小,對於人工智慧而言,在計算過程中可以刪除多餘的選項,選擇最優的打法。

這樣,人類獲勝的機會,只有期望拿到一手驚豔的牌(譬如很齊整的牌,全是炸彈等等),但這種概率是有限的。人們可以贏一局兩局,但是十局八局呢?最終還是輸。麻將、四國軍棋以此類推。如果再算上體力和情緒波動等劣勢,人類獲勝概率10%絕非危言聳聽。

“龍之隊”和冷撲大師這次比的德州撲克,相對于鬥地主和麻將,其實對人類還有利一些。因為它不僅比牌面和詐術,還有心理——心理戰也是人類的優勢,電視劇《勝者為王》中石志康也以此擊敗了植入電腦晶片的屠天龍。

但即便如此,這次德州撲克的人機大戰,人類方還是岌岌可危。因為德州撲克是一種賭局,人都有賭性。在形勢較好的情況下往往失去理性,在處於劣勢的情況下卻又沮喪自棄,或走極端孤注一擲;如果只以一兩把定輸贏,人類有機會劍走偏鋒而取勝;而在漫長的馬拉松牌局中,這樣的勝算被壓到最低。因為人工智慧永遠那麼冷酷無情,不受情緒左右;在牌局的演進中還會不斷學習和提升,熟悉人類選手的打法,採用精准的針對性策略……

人工智慧的時代已經來臨,即便不甘心,我們也必須學著坦然接受。畢竟我們也看到,人工智慧給人類社會帶來許多變革。但所有的前提是,它還在我們的掌控之中。

Next Article
喜欢就按个赞吧!!!
点击关闭提示