您的位置:首頁>歷史>正文

三國歷史真正的轉捩點:白衣渡江 襄樊之戰與夷陵之戰的博弈分析

西元219年發生的襄樊之戰, 以蜀漢劉備部將關羽北伐曹魏, 水淹七軍、圍困襄、樊兩城開端, 以東吳孫權部將呂蒙“白衣渡江”偷襲南郡, 關羽敗走麥城, 身首異處結束。

這是一次典型的囚徒困境。

赤壁之戰前, 劉備與孫權結成聯盟, 約定共同對抗北方最強大的曹操, 以獲得合作收益。 關羽北伐是針對曹操的軍事行為, 可以理解為劉備一方努力履行聯盟的合作契約, 執行合作策略。 孫權一方趁劉備一方正努力執行合作策略, 趁其毫無防範之機, 偷襲了關羽的後方根據地, 導致關羽兵敗身死。 孫權一方的偷襲不是針對曹操的軍事行為,

而是針對劉備的軍事行為, 是典型的執行了背叛策略。

孫權合作孫權背叛劉備合作2, 2-1, 3劉備背叛3, -10, 0

(“, ”左側數值為劉備的收益, 右側數值為孫權的收益)

在單次的囚徒困境博弈模型中, 若博弈雙方同時選擇合作, 則各獲得2收益;同時選擇背叛, 則各獲得0收益;一方選擇合作另一方選擇背叛, 合作方收益-1, 背叛方收益3。 同時選擇合作能讓集體獲得最高收益, 2+2=4。 但是當一方選擇合作給定時, 另一方選擇合作收益2, 選擇背叛收益3, 2<3, 對集體中的個體來說, 當對方會選擇合作時, 其最佳策略是選擇背叛。 同時選擇合作策略, 對集體來說雖然是收益最高的策略, 但對個體來說並不是——損害同伴的利益才能最大化自身利益。

當一方努力履行合作契約時, 另一方有很強的激勵不履行合作契約, 而是採取背叛策略。

作為孫權一方來說, 當劉備一方努力履行合作契約時, 其執行背叛的策略, 的的確確能夠獲得最高收益——這從呂蒙能夠輕而易舉拿下南郡就可以證明——成本低、收益高。

如果只考慮襄樊之戰這一單次博弈, 而不考慮未來, 孫權偷襲南郡能得到最大收益, 是最佳策略。

在單次的囚徒困境博弈模型中, 實際上, 無論對方選什麼, 選擇背叛永遠是最佳策略。 上面我們已經分析了一方選擇合作策略給定時, 另一方的最佳策略是背叛。 若一方選擇背叛給定, 則另一方選擇合作收益-1, 選擇背叛收益0, -1<0, 最佳策略依然是選擇背叛。

作為劉備一方來說, 似乎根本不該考慮履行合作契約, 任何合作的舉動都是劣選策略, 只會降低自己的收益。 關羽的北伐是愚蠢的, 把劉備一方推到了一個註定大敗虧輸的境地——孫權若選擇背叛, 劉備選擇合作的收益是最低的-1。

我見過很多誇讚孫權的偷襲多麼明智, 而諷刺關羽的北伐是多麼愚蠢的言論。 這些言論, 包括我之前的分析, 全部!都錯!錯!錯!

真正出了昏招的孫權!

為什麼?

因為以上我們分析的是單次囚徒困境博弈!所謂單次博弈, 就是說博弈參與者在這次博弈之後就老死不相往來了, 你遇不到我,

我也找不到你, 不會有下一次博弈了。 但現實情況是, 劉備就在西川, 孫權就在江東, 你能找到我, 我想見你也很容易, 今天這次博弈結束之後, 明天還要接著博弈, 並且不知道今後還有多少場博弈。

這種情況叫做無限次數重複博弈。

單次博弈與無限次數重複博弈有什麼區別?後者是要考慮未來的, 前者卻不需要考慮。

未來會發生什麼?

未來會發生收益!

這時一個新策略出現了, 叫做“報復”。 所謂報復, 就是在上一局博弈中, 甲方遭遇乙方背叛, 那麼在下一輪博弈中, 甲方也要對乙方採用背叛策略。 報復雖然針對的是過去的行為, 目的卻是為了獲取更多的未來收益。

重複博弈中,“報復”如何影響博弈結果?

孫權合作孫權背叛劉備合作2,2-1,3劉備背叛3,-10,0

(“,”左側數值為劉備的收益,右側數值為孫權的收益)

在一個共有N輪博弈的重複博弈中,給定甲遭遇背叛就會在下一輪實施報復,不遭遇背叛就會一直合作。第n輪甲合作,乙背叛了,乙收益3;在第n+1輪,甲報復乙,選擇背叛,乙無論如何選擇,收益最高為0;兩輪收益相加總和為3+0=3。第n輪甲合作,乙也選擇合作,乙收益2;由於甲沒有遭到背叛,所以第n+1輪甲會選合作,乙也選合作,收益2,;兩輪收益相加總和為2+2=4。乙背叛甲的兩輪收益總和為3,乙一直與甲合作兩輪收益總和為4,3<4,因此比起背叛,乙更願意跟甲合作。

現在給定甲永遠不會實施報復,即,無論在第n輪乙採用什麼策略,甲在第n+1輪依舊會選合作。第n輪,甲合作,乙合作,乙收益2;第二輪甲合作,乙合作,乙收益2;兩輪相加,乙總共收益4。第n輪甲合作,乙背叛,乙收益3;第n+1輪甲合作,乙背叛,乙收益3;乙兩輪收益相加總和為6。4<6,跟兩輪合作相比,兩輪背叛收益更高。實際上,我們還可以組成其他的策略組合,但是,只要甲永遠選擇合作,乙永遠選擇背叛所得的收益一定是最高的。因此,在甲不會報復的情況下,乙最佳選擇永遠是背叛,甲就永遠無法得到合作收益。

報復提高了背叛者的背叛成本,使背叛的收益小於合作,從而激勵了人們履行合作契約。報復讓自己更安全。當乙認為甲會對背叛行為進行報復的可能性越高的時候,就越不願意背叛甲,反之,乙認為甲會對背叛行為進行報復的可能性越低,就越願意背叛甲。

乙如何判斷甲對背叛行為的進行報復的可能性?看他曾經報復的頻率!曾經實施報復的頻率越高,就說明未來會實施報復的概率也就越高;曾經實施報復的頻率越低,就說明未來會實施報復的概率也就越低。

甲每一次的報復或不報復的決定,都關係著未來博弈中遭遇背叛的可能性。對這一次背叛行為實施了報復,在未來遭遇背叛的可能性就越低,未來合作收益也就越高;不對這一次背叛行為實施報復,在未來遭遇背叛的可能性就越高,未來合作收益也就越低。

為了降低未來博弈中博弈對手的背叛激勵,獲得盡可能多的未來收益,一定要盡可能對每一次背叛行為進行報復!

當孫權派呂蒙趁虛而入,佔領南郡,導致關羽身死時,他就應該料想到,劉備絕不會善罷甘休,因為對背叛行為進行報復關係到未來。但孫權似乎並沒有想到,最起碼沒有想到劉備實施報復的嚴重性。

西元221年,劉備親自率領5萬大軍討伐孫權,發動了夷陵之戰。這一場戰役,孫權部將陸遜“火燒連營”,打得劉備幾乎全軍覆沒——孫權贏了。

有什麼嚴重後果?

孫權與劉備能夠結成聯盟,合作對抗曹操,是因為無論是孫權還是劉備,其能力都不足以完成獨自對抗曹操的目標,合作能讓雙方獲得比單幹更高的收益。只要孫權和劉備無法單獨對抗曹操這一現實不變,雙方合作獲得的收益就會大於單幹獲得的收益。這個博弈的期限是“無限”的——不知道在未來的什麼時候會結束。這也就意味著,這個未來可能很長(從實際情況看,這個未來確實很長),未來越長,雙方就可以從未來的合作中獲得越豐厚的回報。

合作雙方的能力越強,大概率來說,合作收益就會越高。如果一方的能力受到削弱,不僅僅影響到這一方的收益,還會讓另一方的合作收益也減少。

呂蒙“白衣渡江”之前,劉備定軍山之戰斬殺夏侯淵,從曹操手中奪取漢中;襄樊之戰,關羽水淹七軍,斬殺龐德,生擒於禁,圍困襄陽、樊城,逼得曹操考慮遷都以避鋒芒。這些軍事行動給曹操帶來了嚴重的、真實的威脅,曹操必然需要增加力量對來應對劉備一方的行動。對劉備一方增加力量,就意味著沒有更多力量應對孫權一方,即使孫權無力發起對曹操的進攻,自身的防禦壓力總歸會減少,這就提高了孫權一方的收益。

夷陵之戰中劉備損失慘重,導致蜀漢被削弱。蜀漢的衰弱,使曹操可以減少針對蜀漢的力量,將這些力量投入到針對東吳一方。蜀漢的削弱,不僅僅降低了蜀漢獲取收益的能力,同時也降低了東吳獲取收益的能力。

每一輪博弈的合作收益都降低了,那麼未來博弈的輪次越多,也就是未來越長,損失的收益也就越多。

看似襄樊之戰和夷陵之戰孫權都是最後的勝利者,但實際上孫權一方為了眼前的收益,放棄了許許多多未來收益。“白衣渡江”之前,孫劉聯盟給曹魏的帶來了巨大壓力,但是在“白衣渡江”之後,這一聯盟再也沒能對曹魏集團形成實質性的威脅,只是勉強維持不被消滅而已。

那什麼時候應該選擇背叛呢?很明顯,沒有未來的時候!越是沒有未來,就越要背叛,奪取儘量多的眼前收益。比如說曹魏眼看就要被嚴重削弱了,對抗他不需要與劉備結盟了,這時候在孫權看來,孫劉聯盟的未來大概率就要結束了,沒有那麼多未來收益可以獲得了,眼前收益大於未來收益,就應該準備採取背叛策略。

我們引入貼現率P。明天得到2收益,不如立刻得到2收益值錢,因為明天會出現很多意外導致你無法得到這2收益,貼現率就是明天依舊會得到2收益的概率,也可以理解成明天的2收益比幾天的2收益貶值的比率。

若第n輪甲方遭遇乙方背叛,在以後的博弈中,甲就再也不會與乙方合作,則乙方的收益為第n輪背叛的收益3,加以後的無窮個0,最終為3。乙一直與甲合作的收益是第n輪的收益2,加上n+1輪的收益2P,加上n+2輪的收益2P²,加上n+3輪的收益2P³……就是無窮多個2相加。若乙該背叛甲,說明背叛收益高於一直合作的收益,則3>2+2P+2P²+2P³……,求得P小於1/3時,滿足不等式。當下一輪博弈依舊會繼續的概率不小於1/3時,乙背叛甲的收益就小於一直與甲合作的收益,乙就不該背叛;只有預期博弈繼續的概率小於1/3時,乙背叛甲的收益才會大於繼續與甲合作,乙應該背叛甲。

背叛或者合作,與貼現率的大小有關!

這就是為什麼說孫權趁機奪取南郡是一個愚蠢的短視行為,因為在當時的情況看來,曹魏集團會在很長一段時間裡保持最強者地位,這就說明孫劉聯盟合作的貼現率是比較大的,而貼現率大時,選擇合作才是收益最高的策略。

夷陵之戰之後,諸葛亮主持了蜀漢與東吳的重新談判,再一次讓雙方回到了合作的策略上,為什麼蜀漢會願意重新與東吳合作呢?理由是——預期的貼現率特別大。

第n輪甲遭遇乙背叛,乙收益3,n+1輪甲報復乙,選擇背叛,乙收益0,n+2輪甲乙重新合作,乙收益2P²,n+3輪收益2P³……乙一直與甲合作,第n輪收益2,n+1輪收益2P,n+2輪收益2P²,n+3輪收益2P³……滿足背叛收益小於合作,則滿足3≤2+2P,求得P≥1/2。

當貼現率足夠大時,在一輪背叛與一輪報復後,乙與甲合作的未來收益依舊足夠大,乙沒有繼續背叛的激勵,因此甲在報復後,與乙繼續合作可以獲得更多收益。

因為蜀漢和東吳都承認貼現率確實是比較大的,也就是說,雙方合作才能對抗曹魏的現實會延續很長時間,所以雙方才願意重新達成合作關係。

劉備發動夷陵之戰是對的,因為報復是必須的;諸葛亮在夷陵之戰後重新與東吳結成聯盟也是對的,因為需要與東吳合作才能對抗曹魏;但是孫權在關羽北伐曹操的時候偷襲南郡卻是錯的,在貼現率明顯很高的情況下採用了背叛策略,是為了眼前的蠅頭小利放棄了巨大的未來收益,是非常不明智的。

這是可以用數理證明的。

孫劉聯盟的頹勢看起來是從夷陵之戰開始的,實際上在呂蒙“白衣渡江”之時,歷史的天平已經開始傾斜了。劉備死後,諸葛亮主持了蜀漢與東吳的重新談判,又達成了合作關係,但是,勢已成,不可逆,結局已經寫就,回天乏力了。

作者:第五大洋,歷史百家爭鳴特約作者

重複博弈中,“報復”如何影響博弈結果?

孫權合作孫權背叛劉備合作2,2-1,3劉備背叛3,-10,0

(“,”左側數值為劉備的收益,右側數值為孫權的收益)

在一個共有N輪博弈的重複博弈中,給定甲遭遇背叛就會在下一輪實施報復,不遭遇背叛就會一直合作。第n輪甲合作,乙背叛了,乙收益3;在第n+1輪,甲報復乙,選擇背叛,乙無論如何選擇,收益最高為0;兩輪收益相加總和為3+0=3。第n輪甲合作,乙也選擇合作,乙收益2;由於甲沒有遭到背叛,所以第n+1輪甲會選合作,乙也選合作,收益2,;兩輪收益相加總和為2+2=4。乙背叛甲的兩輪收益總和為3,乙一直與甲合作兩輪收益總和為4,3<4,因此比起背叛,乙更願意跟甲合作。

現在給定甲永遠不會實施報復,即,無論在第n輪乙採用什麼策略,甲在第n+1輪依舊會選合作。第n輪,甲合作,乙合作,乙收益2;第二輪甲合作,乙合作,乙收益2;兩輪相加,乙總共收益4。第n輪甲合作,乙背叛,乙收益3;第n+1輪甲合作,乙背叛,乙收益3;乙兩輪收益相加總和為6。4<6,跟兩輪合作相比,兩輪背叛收益更高。實際上,我們還可以組成其他的策略組合,但是,只要甲永遠選擇合作,乙永遠選擇背叛所得的收益一定是最高的。因此,在甲不會報復的情況下,乙最佳選擇永遠是背叛,甲就永遠無法得到合作收益。

報復提高了背叛者的背叛成本,使背叛的收益小於合作,從而激勵了人們履行合作契約。報復讓自己更安全。當乙認為甲會對背叛行為進行報復的可能性越高的時候,就越不願意背叛甲,反之,乙認為甲會對背叛行為進行報復的可能性越低,就越願意背叛甲。

乙如何判斷甲對背叛行為的進行報復的可能性?看他曾經報復的頻率!曾經實施報復的頻率越高,就說明未來會實施報復的概率也就越高;曾經實施報復的頻率越低,就說明未來會實施報復的概率也就越低。

甲每一次的報復或不報復的決定,都關係著未來博弈中遭遇背叛的可能性。對這一次背叛行為實施了報復,在未來遭遇背叛的可能性就越低,未來合作收益也就越高;不對這一次背叛行為實施報復,在未來遭遇背叛的可能性就越高,未來合作收益也就越低。

為了降低未來博弈中博弈對手的背叛激勵,獲得盡可能多的未來收益,一定要盡可能對每一次背叛行為進行報復!

當孫權派呂蒙趁虛而入,佔領南郡,導致關羽身死時,他就應該料想到,劉備絕不會善罷甘休,因為對背叛行為進行報復關係到未來。但孫權似乎並沒有想到,最起碼沒有想到劉備實施報復的嚴重性。

西元221年,劉備親自率領5萬大軍討伐孫權,發動了夷陵之戰。這一場戰役,孫權部將陸遜“火燒連營”,打得劉備幾乎全軍覆沒——孫權贏了。

有什麼嚴重後果?

孫權與劉備能夠結成聯盟,合作對抗曹操,是因為無論是孫權還是劉備,其能力都不足以完成獨自對抗曹操的目標,合作能讓雙方獲得比單幹更高的收益。只要孫權和劉備無法單獨對抗曹操這一現實不變,雙方合作獲得的收益就會大於單幹獲得的收益。這個博弈的期限是“無限”的——不知道在未來的什麼時候會結束。這也就意味著,這個未來可能很長(從實際情況看,這個未來確實很長),未來越長,雙方就可以從未來的合作中獲得越豐厚的回報。

合作雙方的能力越強,大概率來說,合作收益就會越高。如果一方的能力受到削弱,不僅僅影響到這一方的收益,還會讓另一方的合作收益也減少。

呂蒙“白衣渡江”之前,劉備定軍山之戰斬殺夏侯淵,從曹操手中奪取漢中;襄樊之戰,關羽水淹七軍,斬殺龐德,生擒於禁,圍困襄陽、樊城,逼得曹操考慮遷都以避鋒芒。這些軍事行動給曹操帶來了嚴重的、真實的威脅,曹操必然需要增加力量對來應對劉備一方的行動。對劉備一方增加力量,就意味著沒有更多力量應對孫權一方,即使孫權無力發起對曹操的進攻,自身的防禦壓力總歸會減少,這就提高了孫權一方的收益。

夷陵之戰中劉備損失慘重,導致蜀漢被削弱。蜀漢的衰弱,使曹操可以減少針對蜀漢的力量,將這些力量投入到針對東吳一方。蜀漢的削弱,不僅僅降低了蜀漢獲取收益的能力,同時也降低了東吳獲取收益的能力。

每一輪博弈的合作收益都降低了,那麼未來博弈的輪次越多,也就是未來越長,損失的收益也就越多。

看似襄樊之戰和夷陵之戰孫權都是最後的勝利者,但實際上孫權一方為了眼前的收益,放棄了許許多多未來收益。“白衣渡江”之前,孫劉聯盟給曹魏的帶來了巨大壓力,但是在“白衣渡江”之後,這一聯盟再也沒能對曹魏集團形成實質性的威脅,只是勉強維持不被消滅而已。

那什麼時候應該選擇背叛呢?很明顯,沒有未來的時候!越是沒有未來,就越要背叛,奪取儘量多的眼前收益。比如說曹魏眼看就要被嚴重削弱了,對抗他不需要與劉備結盟了,這時候在孫權看來,孫劉聯盟的未來大概率就要結束了,沒有那麼多未來收益可以獲得了,眼前收益大於未來收益,就應該準備採取背叛策略。

我們引入貼現率P。明天得到2收益,不如立刻得到2收益值錢,因為明天會出現很多意外導致你無法得到這2收益,貼現率就是明天依舊會得到2收益的概率,也可以理解成明天的2收益比幾天的2收益貶值的比率。

若第n輪甲方遭遇乙方背叛,在以後的博弈中,甲就再也不會與乙方合作,則乙方的收益為第n輪背叛的收益3,加以後的無窮個0,最終為3。乙一直與甲合作的收益是第n輪的收益2,加上n+1輪的收益2P,加上n+2輪的收益2P²,加上n+3輪的收益2P³……就是無窮多個2相加。若乙該背叛甲,說明背叛收益高於一直合作的收益,則3>2+2P+2P²+2P³……,求得P小於1/3時,滿足不等式。當下一輪博弈依舊會繼續的概率不小於1/3時,乙背叛甲的收益就小於一直與甲合作的收益,乙就不該背叛;只有預期博弈繼續的概率小於1/3時,乙背叛甲的收益才會大於繼續與甲合作,乙應該背叛甲。

背叛或者合作,與貼現率的大小有關!

這就是為什麼說孫權趁機奪取南郡是一個愚蠢的短視行為,因為在當時的情況看來,曹魏集團會在很長一段時間裡保持最強者地位,這就說明孫劉聯盟合作的貼現率是比較大的,而貼現率大時,選擇合作才是收益最高的策略。

夷陵之戰之後,諸葛亮主持了蜀漢與東吳的重新談判,再一次讓雙方回到了合作的策略上,為什麼蜀漢會願意重新與東吳合作呢?理由是——預期的貼現率特別大。

第n輪甲遭遇乙背叛,乙收益3,n+1輪甲報復乙,選擇背叛,乙收益0,n+2輪甲乙重新合作,乙收益2P²,n+3輪收益2P³……乙一直與甲合作,第n輪收益2,n+1輪收益2P,n+2輪收益2P²,n+3輪收益2P³……滿足背叛收益小於合作,則滿足3≤2+2P,求得P≥1/2。

當貼現率足夠大時,在一輪背叛與一輪報復後,乙與甲合作的未來收益依舊足夠大,乙沒有繼續背叛的激勵,因此甲在報復後,與乙繼續合作可以獲得更多收益。

因為蜀漢和東吳都承認貼現率確實是比較大的,也就是說,雙方合作才能對抗曹魏的現實會延續很長時間,所以雙方才願意重新達成合作關係。

劉備發動夷陵之戰是對的,因為報復是必須的;諸葛亮在夷陵之戰後重新與東吳結成聯盟也是對的,因為需要與東吳合作才能對抗曹魏;但是孫權在關羽北伐曹操的時候偷襲南郡卻是錯的,在貼現率明顯很高的情況下採用了背叛策略,是為了眼前的蠅頭小利放棄了巨大的未來收益,是非常不明智的。

這是可以用數理證明的。

孫劉聯盟的頹勢看起來是從夷陵之戰開始的,實際上在呂蒙“白衣渡江”之時,歷史的天平已經開始傾斜了。劉備死後,諸葛亮主持了蜀漢與東吳的重新談判,又達成了合作關係,但是,勢已成,不可逆,結局已經寫就,回天乏力了。

作者:第五大洋,歷史百家爭鳴特約作者

Next Article
喜欢就按个赞吧!!!
点击关闭提示