冷撲大師即將對戰“龍之隊”
今年1月, 美國卡耐基梅隆大學開發的人工智慧Libratus(冷撲大師)與4名人類頂尖德州撲克選手展開了一場“人機大戰”,
之前我在一篇文章中寫到, 在圍棋和象棋這樣的“完美遊戲”中, 人工智慧可以通過深度學習和強大的計算力, 暴虐人類, 而在四國軍棋、撲克牌等具有欺騙性的遊戲中占不到便宜。
我們認可人工智慧在圍棋、象棋領域的壓倒性優勢,
但是撲克牌、麻將、四國軍棋等遊戲,
本身具有欺詐性、偶然性、變化性,
其決定勝負的因素超出了“計算力”所覆蓋的範疇。
譬如撲克和麻將每次上手摸到的牌,
四國軍棋的佈陣,
都會增加局面的複雜性和未知性。
同時,
不像圍棋那樣完全憑“硬實力”對話,
撲克或麻將有一些以弱勝強的翻盤機會,
增加了遊戲的參與性和趣味性。
關於“欺詐性”或“詐術”, 也是這類遊戲中運用較多的部分, 這也被認為是人類獨有的特點和優勢, 目前的人工智慧還無法企及。 記得科幻小說《三體》中也提到,
延展到牌局上來看, 由於撲克和麻將具有未知性, 參與者不清楚對方手中的牌,
冷撲大師的開發者Andrew Moore坦言, 冷撲大師不會詐術, 它只是採用大量數學, 根據現有的局面計算出什麼打法是最優化的, 如何產生最高的勝率。 其難點在於, 人們會使用多樣的欺詐招數, 程式必須去一一檢查, 但不一定能查得出。
如果用現在的人工智慧和人類比打仗, 應該還差了一截。 但是撲克、麻將和戰爭不同。 用強大的計算和深度學習能力, 已經可以彌補謀略上的不足。 以鬥地主為例, 兩副牌只有108張, 牌型只有單張、一對、三條、三帶二、三姐妹、炸彈等不到10種。 首先, 人工智慧拿到手牌之後, 根據歷史資料和相應計算, 可以判斷出當地主或當農民的勝率, 並在理牌時算出自己的最優出牌組合;第二, 在幾個出牌輪次之後, 人工智慧可以輕鬆計算出消耗掉多少張大小王、2、A、K、Q、J, 甚至連10以內的牌算得清清楚楚(一般人類高手能算清10以上的大牌出處就挺厲害了);第三, 越到殘局,人工智慧優勢越明顯。因為人類手上的牌越出越少,剩餘的牌型組合可能性也越來越小,對於人工智慧而言,在計算過程中可以刪除多餘的選項,選擇最優的打法。
這樣,人類獲勝的機會,只有期望拿到一手驚豔的牌(譬如很齊整的牌,全是炸彈等等),但這種概率是有限的。人們可以贏一局兩局,但是十局八局呢?最終還是輸。麻將、四國軍棋以此類推。如果再算上體力和情緒波動等劣勢,人類獲勝概率10%絕非危言聳聽。
“龍之隊”和冷撲大師這次比的德州撲克,相對于鬥地主和麻將,其實對人類還有利一些。因為它不僅比牌面和詐術,還有心理——心理戰也是人類的優勢,電視劇《勝者為王》中石志康也以此擊敗了植入電腦晶片的屠天龍。
但即便如此,這次德州撲克的人機大戰,人類方還是岌岌可危。因為德州撲克是一種賭局,人都有賭性。在形勢較好的情況下往往失去理性,在處於劣勢的情況下卻又沮喪自棄,或走極端孤注一擲;如果只以一兩把定輸贏,人類有機會劍走偏鋒而取勝;而在漫長的馬拉松牌局中,這樣的勝算被壓到最低。因為人工智慧永遠那麼冷酷無情,不受情緒左右;在牌局的演進中還會不斷學習和提升,熟悉人類選手的打法,採用精准的針對性策略……
人工智慧的時代已經來臨,即便不甘心,我們也必須學著坦然接受。畢竟我們也看到,人工智慧給人類社會帶來許多變革。但所有的前提是,它還在我們的掌控之中。
越到殘局,人工智慧優勢越明顯。因為人類手上的牌越出越少,剩餘的牌型組合可能性也越來越小,對於人工智慧而言,在計算過程中可以刪除多餘的選項,選擇最優的打法。這樣,人類獲勝的機會,只有期望拿到一手驚豔的牌(譬如很齊整的牌,全是炸彈等等),但這種概率是有限的。人們可以贏一局兩局,但是十局八局呢?最終還是輸。麻將、四國軍棋以此類推。如果再算上體力和情緒波動等劣勢,人類獲勝概率10%絕非危言聳聽。
“龍之隊”和冷撲大師這次比的德州撲克,相對于鬥地主和麻將,其實對人類還有利一些。因為它不僅比牌面和詐術,還有心理——心理戰也是人類的優勢,電視劇《勝者為王》中石志康也以此擊敗了植入電腦晶片的屠天龍。
但即便如此,這次德州撲克的人機大戰,人類方還是岌岌可危。因為德州撲克是一種賭局,人都有賭性。在形勢較好的情況下往往失去理性,在處於劣勢的情況下卻又沮喪自棄,或走極端孤注一擲;如果只以一兩把定輸贏,人類有機會劍走偏鋒而取勝;而在漫長的馬拉松牌局中,這樣的勝算被壓到最低。因為人工智慧永遠那麼冷酷無情,不受情緒左右;在牌局的演進中還會不斷學習和提升,熟悉人類選手的打法,採用精准的針對性策略……
人工智慧的時代已經來臨,即便不甘心,我們也必須學著坦然接受。畢竟我們也看到,人工智慧給人類社會帶來許多變革。但所有的前提是,它還在我們的掌控之中。