您的位置:首頁>體育>正文

理論物理博士眼中的德州撲克 因布朗運動頓悟

余小魯博士(右)接受專訪

余小魯, 理論物理博士, 人工智慧專家。 在美國多年, 熟悉各種西方流行的撲克遊戲。 從數學、邏輯學、心理學等多方面系統研究撲克遊戲模型,

對撲克人工智慧有獨到見解。 新浪撲克學院特邀講師。

問:聽說最近有為一些金融圈的朋友講解德州撲克, 他們最感興趣的是哪方面?

答:哈哈, 不能說是講解, 應該說是切磋吧, 大陸民間的德州撲克高手太多了, 可謂臥虎藏龍。 金融圈和德州撲克有一種天然的聯繫, 從華爾街的交易員轉行去打德州撲克的有很多, 從德州撲克轉行去當交易員也有。 最近有傳言說女子德州撲克第一人Vanessa Selbst也準備進軍華爾街(Vanessa Selbst, 84年生, 耶魯法學院畢業, 職業生涯錦標賽總獎金超過一千萬美金)。

著名女牌手 Vanessa Selbst

簡單說, 金融圈最感興趣的就是風險。 德州撲克對玩家的一個大的考驗, 就是要長期保持一種風險中性(risk neutral)的態度。 舉個例子, 你面前有兩種打法, 一種是有20%的機會贏得五千個籌碼, 一種是有百分之百的機會贏得八百個籌碼。 大腦裡面固有的風險偏好, 讓我們很難選擇第一種打法。 但恰恰在絕大多數的金融市場和德州牌桌上, 要當長期的成功玩家,

必須學會自然的選擇第一種打法。 再舉個具體一點的例子, 面對一個30bb的底池在河牌圈, 你可以很自然的可以下注20bb做一個詐唬。 但如果同樣的牌同樣的局面, 底池有300bb, 讓你all in200bb做一個詐唬, 很多人打了十年牌, 覺得很荒唐很冒險, 自己也很少嘗試過, 或者說嘗試過一兩次失敗了, 刻骨銘心, 然後就放棄了這種打法。 本質上說, 就是大腦裡面覺得輸掉桌子上剩下的200bb籌碼的痛苦程度, 遠遠超過贏得底池300bb的快樂程度。 金融市場和德州撲克都是要培養面對風險客觀理性的態度。

問:冒昧的問一句, 您覺得理論物理跟德州撲克有什麼聯繫麼?

答:沒啥聯繫, 哈哈, 可能跟金融聯繫反而大了一點, 華爾街裡面一堆物理學博士。 理論物理的價值觀是這樣的,

追求從第一性原理開始的分析推理, 不做過多的假設, 對任意一個新的假設都抱著懷疑的態度, 千方百計去證偽。 牛頓在其劃時代巨著《自然哲學的數學原理》中說, “我不做假設(Hypotheses non fingo)”, 呵呵, 其實牛頓三定律和萬有引力定律都是牛頓的假設, 但這假設絕對的少, 幾乎完美解釋了整個太陽系的運動。

清代圍棋國手施襄夏

您是圍棋高手, 我用圍棋的例子吧。 第一性原理對待圍棋, 就是從圍棋的勝負規則和死活規則開始研究圍棋, 不是從佈局理論定式來開始研究。 佈局理論定式這些威力非常的大, 但不是第一性的, 是從圍棋的勝負規則和死活規則自然演繹出來的。 圍棋的第一性原理, 就是氣盡棋亡。 直接的推論, 就是氣要不會盡, 大多時候需要有兩個眼。 然後就開始研究如何容易有兩個眼, 如何圍空效率高。 中國古人的圍棋理論非常高明, 清代施襄夏的總決開篇第一句, 起手據邊隅, 逸己攻人原在是。 這個理論要解釋圍棋佈局起手為什麼是下在邊角上, 是因為自己容易活(逸),容易活的地方被你占了對手就不容易活,叫“逸己攻人”,過了三百年,現在巔峰造極的阿爾法圍棋,依然是起手據邊隅,這就是理論思考的力量。接下來第二句叫入腹爭正面,制孤克敵驗於斯。必須注意,這就不是第一性原理的直接推論了,所以開始模糊,理論開始變得“危險”。因為人為定義了一個概念叫“正面”,進入圍棋中腹的正面究竟是哪一面?但這個理論依然威力非常強大,頂尖高手心中都有正逆向背的概念。但入腹爭正面只能稱之為一個假設,也許是一個非常好的假設。

理論物理的思維模式,就是先承認並且透徹研究第一性原理,對其他任何假設都抱著批判的態度。德州撲克的第一性原理可以這麼表述:你看不到對方的底牌,對方也看不到你的底牌。聽起來很白癡,但如果能透徹認識這一點,已經是德州撲克的高手了。因為這個第一性原理的直接推論,就是你必須承認對手的持牌是一個範圍(Range,德州撲克最重要的一個概念),同時承認你的持牌也是一個範圍(不只是你眼睛中看到的現在持有的兩張底牌)。在美國很多學生跟我這麼說,對手這把牌這麼打,肯定手上拿著是AK,最後翻出來也是AK,學生很高興。但這種思維方式非常危險,因為你不知不覺中做了一個很大膽的假設,就是你能讀死對手的持牌,不再是個範圍。理論物理的訓練,主要是讓我能克服種種關於德州撲克流行的假設,或者說種種“偽理論”的迷思,這應該也是我到目前戰績還不錯的一個主要原因。當然,從純粹理論物理的觀點來講,不能排除另一個可能,就是我在牌桌上一直運氣都比較好。

問:余博士最近在研究德州撲克人工智慧的事情,有什麼特別的心得麼?

答:我對這方面的長期關注,跟你對圍棋人工智慧的長期關注,可能心情上是差不多的。因為我自己是從事人工智慧這個行業,可能關注得更多的人工智慧的技術而不是德州撲克了,哈哈。這方面的內容,有興趣的讀者可以參考我在新浪最近的一個訪談。

相關閱讀:德州撲克被AI攻破? 剛進行到圍棋九路盤而已

問:從人工智慧的角度,您覺得德撲AI想在類似MTT比賽中取得碾壓人類的成績,應該從哪方面入手?

答:這是一個理論性的難題,不是願意投入多少個CPU,多少個電腦專家,就能從現在的冷撲程式改良得到的。因為冷撲面對的是單挑一對一德州撲克,其納什均衡是可以求解,或者說平均每手牌距離博弈論最優解不到千分之一個大盲注,完美得嚇人。但必須注意,再多一個玩家,三個玩家的德州撲克,數學上已經無法保證epsilon收斂到納什均衡。對於多人多桌錦標賽,學術上要在冷撲這個思路上改良,做到能適合多種獎池結構多人遊戲的博弈論分析,非常之困難。人類目前在多人多桌錦標賽上運用的數學理論本身就有很大問題,在目前階段最多稱之為模型,比如說流行ICM(Independent Chip Model)獨立籌碼模型,是非常粗糙的一級近似。但這恰恰是德州撲克錦標賽最有趣的地方。

多人比賽 是德州撲克人工智慧的瓶頸

問:好像不久前去參加了Tom Dwan的見面會,感受如何?

答:非常感謝新浪撲克學院的邀請,這次見面會讓我很感動,哈哈。感動的不是tom的牌技,tom打牌看太多了,感動的是主辦方包括新浪撲克學院的一系列安排。撲克俱樂部邀請tom dwan,相當於高爾夫俱樂部邀請泰格伍茲,斯諾克俱樂部邀請奧薩利文,是非常麻煩的事情。考驗的是撲克學院運營的能力,這些遠遠比學德州撲克牌技難。活動的場地條件安排都非常優越,但我想這不是最重要的。重要的是來參加這次活動,喜歡德州撲克的玩家,很多都是來自各行各業裡面的高手,這一次見面會讓我認識了很多有趣的新朋友,非常的難得。以新浪撲克學院的資源背景種種條件,在大陸德州這個方興未艾的階段,大有作為,值得期待。

Dwan上海見面會

問:圍棋的教學我很明白,但德州撲克究竟如何教?如何學?

答:那我用圍棋的比喻來解釋吧。教的話,最重要的是資格,或者說是對資格的信心。比如說你是新浪圍棋7段,我覺得你最多能教新浪圍棋6段的學生。假設說你的學生是新浪圍棋8段,有個微妙的局面下他走錯了,你看出來了跟他解釋,因為微妙的局面下理由往往也比較微妙,他即使願意相信你,他對你本身的棋力沒有足夠的信心,很容易動搖。這時候柯潔跟你學生把同樣的理由用同樣的話再解釋了一遍,你學生就變得非常清晰。這就是教學的微妙之處。而且德州撲克的局面往往比圍棋更加模糊更加微妙,如果老師本身的水準不能給學生足夠的信心,很難起到教學的作用。所以我一向的宗旨就是,平常自己打報名費四百美金的比賽,最多就收打報名費兩百美金比賽的學生。

對於如何學習德州撲克,我只有一個要求,就是紀律性,不是智商不是年齡不是任何其它因素。舉個具體例子,比如我一直對學生有個硬性要求,就是永遠不要講自己被爆冷門(bad beat)的故事。但有些學生確實做不到這一點,閒聊的時候,聽我講課的時候,總會時不時說自己河牌被對手擊中兩個outers之類的事情。對於這些,我是零容忍的,當然每個老師都不一樣。在我對德州撲克理解的體系中,任何時候都不能講這些故事,因為這在潛意識裡面對你牌技的長進有很大的負面影響。當然,要是你以後成為了非常成功的職業牌手,那時憶苦思甜,可以講講這些故事,關係不大,但在初學階段,萬萬不可。這就是我最看重學生的一個品質,紀律性。能控制住不跟任何人講述自己在德州撲克被爆冷門的故事,對我來說,這個學生就具備成為德州撲克高手的一切條件。

問:打撲克讓你印象最深的一件事是?

答:可能每一個長期的德州撲克玩家,都各有各的“頓悟”瞬間。我自己印象最深的“頓悟”,不是在牌桌上悟到的,哈哈,而是在多年前學物理學的時候。大家可能都聽說過布朗運動,就是花粉顆粒在水溶液中不停的做無規則運動。記得當年我學習布朗運動在數學上的理論,叫瑪律可夫過程,簡單的說,這種過程必須具備“無記憶”的性質:下一狀態的概率分佈只能由當前狀態決定,在時間序列中與之前的歷史無關。學到這裡,我突然嚇了一大跳,意識到德州撲克比賽就是一個瑪律可夫過程,狀態就是你桌子的籌碼量。比如我桌子上現在有一萬個籌碼,是剛剛由五千個籌碼翻倍贏來的,還是兩萬個籌碼被別人一個bad beat輸了一半剩下的,數學上是絕對無區別的,也就是說接下來我在這個比賽的成績,只跟我現在有一萬個籌碼這個事實相關,跟我如何擁有這一萬個籌碼的歷史無關。但對人來說,兩者的區別是天上地下。人性雖然是不可以完全克服,但從這個時候起,就儘量讓自己像水中的花粉,完全“無記憶”的打牌。

“無記憶”打牌

(白夜)

是因為自己容易活(逸),容易活的地方被你占了對手就不容易活,叫“逸己攻人”,過了三百年,現在巔峰造極的阿爾法圍棋,依然是起手據邊隅,這就是理論思考的力量。接下來第二句叫入腹爭正面,制孤克敵驗於斯。必須注意,這就不是第一性原理的直接推論了,所以開始模糊,理論開始變得“危險”。因為人為定義了一個概念叫“正面”,進入圍棋中腹的正面究竟是哪一面?但這個理論依然威力非常強大,頂尖高手心中都有正逆向背的概念。但入腹爭正面只能稱之為一個假設,也許是一個非常好的假設。

理論物理的思維模式,就是先承認並且透徹研究第一性原理,對其他任何假設都抱著批判的態度。德州撲克的第一性原理可以這麼表述:你看不到對方的底牌,對方也看不到你的底牌。聽起來很白癡,但如果能透徹認識這一點,已經是德州撲克的高手了。因為這個第一性原理的直接推論,就是你必須承認對手的持牌是一個範圍(Range,德州撲克最重要的一個概念),同時承認你的持牌也是一個範圍(不只是你眼睛中看到的現在持有的兩張底牌)。在美國很多學生跟我這麼說,對手這把牌這麼打,肯定手上拿著是AK,最後翻出來也是AK,學生很高興。但這種思維方式非常危險,因為你不知不覺中做了一個很大膽的假設,就是你能讀死對手的持牌,不再是個範圍。理論物理的訓練,主要是讓我能克服種種關於德州撲克流行的假設,或者說種種“偽理論”的迷思,這應該也是我到目前戰績還不錯的一個主要原因。當然,從純粹理論物理的觀點來講,不能排除另一個可能,就是我在牌桌上一直運氣都比較好。

問:余博士最近在研究德州撲克人工智慧的事情,有什麼特別的心得麼?

答:我對這方面的長期關注,跟你對圍棋人工智慧的長期關注,可能心情上是差不多的。因為我自己是從事人工智慧這個行業,可能關注得更多的人工智慧的技術而不是德州撲克了,哈哈。這方面的內容,有興趣的讀者可以參考我在新浪最近的一個訪談。

相關閱讀:德州撲克被AI攻破? 剛進行到圍棋九路盤而已

問:從人工智慧的角度,您覺得德撲AI想在類似MTT比賽中取得碾壓人類的成績,應該從哪方面入手?

答:這是一個理論性的難題,不是願意投入多少個CPU,多少個電腦專家,就能從現在的冷撲程式改良得到的。因為冷撲面對的是單挑一對一德州撲克,其納什均衡是可以求解,或者說平均每手牌距離博弈論最優解不到千分之一個大盲注,完美得嚇人。但必須注意,再多一個玩家,三個玩家的德州撲克,數學上已經無法保證epsilon收斂到納什均衡。對於多人多桌錦標賽,學術上要在冷撲這個思路上改良,做到能適合多種獎池結構多人遊戲的博弈論分析,非常之困難。人類目前在多人多桌錦標賽上運用的數學理論本身就有很大問題,在目前階段最多稱之為模型,比如說流行ICM(Independent Chip Model)獨立籌碼模型,是非常粗糙的一級近似。但這恰恰是德州撲克錦標賽最有趣的地方。

多人比賽 是德州撲克人工智慧的瓶頸

問:好像不久前去參加了Tom Dwan的見面會,感受如何?

答:非常感謝新浪撲克學院的邀請,這次見面會讓我很感動,哈哈。感動的不是tom的牌技,tom打牌看太多了,感動的是主辦方包括新浪撲克學院的一系列安排。撲克俱樂部邀請tom dwan,相當於高爾夫俱樂部邀請泰格伍茲,斯諾克俱樂部邀請奧薩利文,是非常麻煩的事情。考驗的是撲克學院運營的能力,這些遠遠比學德州撲克牌技難。活動的場地條件安排都非常優越,但我想這不是最重要的。重要的是來參加這次活動,喜歡德州撲克的玩家,很多都是來自各行各業裡面的高手,這一次見面會讓我認識了很多有趣的新朋友,非常的難得。以新浪撲克學院的資源背景種種條件,在大陸德州這個方興未艾的階段,大有作為,值得期待。

Dwan上海見面會

問:圍棋的教學我很明白,但德州撲克究竟如何教?如何學?

答:那我用圍棋的比喻來解釋吧。教的話,最重要的是資格,或者說是對資格的信心。比如說你是新浪圍棋7段,我覺得你最多能教新浪圍棋6段的學生。假設說你的學生是新浪圍棋8段,有個微妙的局面下他走錯了,你看出來了跟他解釋,因為微妙的局面下理由往往也比較微妙,他即使願意相信你,他對你本身的棋力沒有足夠的信心,很容易動搖。這時候柯潔跟你學生把同樣的理由用同樣的話再解釋了一遍,你學生就變得非常清晰。這就是教學的微妙之處。而且德州撲克的局面往往比圍棋更加模糊更加微妙,如果老師本身的水準不能給學生足夠的信心,很難起到教學的作用。所以我一向的宗旨就是,平常自己打報名費四百美金的比賽,最多就收打報名費兩百美金比賽的學生。

對於如何學習德州撲克,我只有一個要求,就是紀律性,不是智商不是年齡不是任何其它因素。舉個具體例子,比如我一直對學生有個硬性要求,就是永遠不要講自己被爆冷門(bad beat)的故事。但有些學生確實做不到這一點,閒聊的時候,聽我講課的時候,總會時不時說自己河牌被對手擊中兩個outers之類的事情。對於這些,我是零容忍的,當然每個老師都不一樣。在我對德州撲克理解的體系中,任何時候都不能講這些故事,因為這在潛意識裡面對你牌技的長進有很大的負面影響。當然,要是你以後成為了非常成功的職業牌手,那時憶苦思甜,可以講講這些故事,關係不大,但在初學階段,萬萬不可。這就是我最看重學生的一個品質,紀律性。能控制住不跟任何人講述自己在德州撲克被爆冷門的故事,對我來說,這個學生就具備成為德州撲克高手的一切條件。

問:打撲克讓你印象最深的一件事是?

答:可能每一個長期的德州撲克玩家,都各有各的“頓悟”瞬間。我自己印象最深的“頓悟”,不是在牌桌上悟到的,哈哈,而是在多年前學物理學的時候。大家可能都聽說過布朗運動,就是花粉顆粒在水溶液中不停的做無規則運動。記得當年我學習布朗運動在數學上的理論,叫瑪律可夫過程,簡單的說,這種過程必須具備“無記憶”的性質:下一狀態的概率分佈只能由當前狀態決定,在時間序列中與之前的歷史無關。學到這裡,我突然嚇了一大跳,意識到德州撲克比賽就是一個瑪律可夫過程,狀態就是你桌子的籌碼量。比如我桌子上現在有一萬個籌碼,是剛剛由五千個籌碼翻倍贏來的,還是兩萬個籌碼被別人一個bad beat輸了一半剩下的,數學上是絕對無區別的,也就是說接下來我在這個比賽的成績,只跟我現在有一萬個籌碼這個事實相關,跟我如何擁有這一萬個籌碼的歷史無關。但對人來說,兩者的區別是天上地下。人性雖然是不可以完全克服,但從這個時候起,就儘量讓自己像水中的花粉,完全“無記憶”的打牌。

“無記憶”打牌

(白夜)

Next Article
喜欢就按个赞吧!!!
点击关闭提示