三國歷史真正的轉捩點：白衣渡江襄樊之戰與夷陵之戰的博弈分析

西元219年發生的襄樊之戰，以蜀漢劉備部將關羽北伐曹魏，水淹七軍、圍困襄、樊兩城開端，以東吳孫權部將呂蒙“白衣渡江”偷襲南郡，關羽敗走麥城，身首異處結束。

這是一次典型的囚徒困境。

赤壁之戰前，劉備與孫權結成聯盟，約定共同對抗北方最強大的曹操，以獲得合作收益。關羽北伐是針對曹操的軍事行為，可以理解為劉備一方努力履行聯盟的合作契約，執行合作策略。孫權一方趁劉備一方正努力執行合作策略，趁其毫無防範之機，偷襲了關羽的後方根據地，導致關羽兵敗身死。孫權一方的偷襲不是針對曹操的軍事行為，

而是針對劉備的軍事行為，是典型的執行了背叛策略。

孫權合作孫權背叛劉備合作2， 2-1， 3劉備背叛3， -10， 0

（“， ”左側數值為劉備的收益，右側數值為孫權的收益）

在單次的囚徒困境博弈模型中，若博弈雙方同時選擇合作，則各獲得2收益；同時選擇背叛，則各獲得0收益；一方選擇合作另一方選擇背叛，合作方收益-1，背叛方收益3。同時選擇合作能讓集體獲得最高收益， 2+2=4。但是當一方選擇合作給定時，另一方選擇合作收益2，選擇背叛收益3， 2＜3，對集體中的個體來說，當對方會選擇合作時，其最佳策略是選擇背叛。同時選擇合作策略，對集體來說雖然是收益最高的策略，但對個體來說並不是——損害同伴的利益才能最大化自身利益。

當一方努力履行合作契約時，另一方有很強的激勵不履行合作契約，而是採取背叛策略。

作為孫權一方來說，當劉備一方努力履行合作契約時，其執行背叛的策略，的的確確能夠獲得最高收益——這從呂蒙能夠輕而易舉拿下南郡就可以證明——成本低、收益高。

如果只考慮襄樊之戰這一單次博弈，而不考慮未來，孫權偷襲南郡能得到最大收益，是最佳策略。

在單次的囚徒困境博弈模型中，實際上，無論對方選什麼，選擇背叛永遠是最佳策略。上面我們已經分析了一方選擇合作策略給定時，另一方的最佳策略是背叛。若一方選擇背叛給定，則另一方選擇合作收益-1，選擇背叛收益0， -1＜0，最佳策略依然是選擇背叛。

作為劉備一方來說，似乎根本不該考慮履行合作契約，任何合作的舉動都是劣選策略，只會降低自己的收益。關羽的北伐是愚蠢的，把劉備一方推到了一個註定大敗虧輸的境地——孫權若選擇背叛，劉備選擇合作的收益是最低的-1。

我見過很多誇讚孫權的偷襲多麼明智，而諷刺關羽的北伐是多麼愚蠢的言論。這些言論，包括我之前的分析，全部！都錯！錯！錯！

真正出了昏招的孫權！

為什麼？

因為以上我們分析的是單次囚徒困境博弈！所謂單次博弈，就是說博弈參與者在這次博弈之後就老死不相往來了，你遇不到我，

我也找不到你，不會有下一次博弈了。但現實情況是，劉備就在西川，孫權就在江東，你能找到我，我想見你也很容易，今天這次博弈結束之後，明天還要接著博弈，並且不知道今後還有多少場博弈。

這種情況叫做無限次數重複博弈。

單次博弈與無限次數重複博弈有什麼區別？後者是要考慮未來的，前者卻不需要考慮。

未來會發生什麼？

未來會發生收益！

這時一個新策略出現了，叫做“報復”。所謂報復，就是在上一局博弈中，甲方遭遇乙方背叛，那麼在下一輪博弈中，甲方也要對乙方採用背叛策略。報復雖然針對的是過去的行為，目的卻是為了獲取更多的未來收益。

重複博弈中，“報復”如何影響博弈結果？

孫權合作孫權背叛劉備合作2，2-1，3劉備背叛3，-10，0

（“，”左側數值為劉備的收益，右側數值為孫權的收益）

在一個共有N輪博弈的重複博弈中，給定甲遭遇背叛就會在下一輪實施報復，不遭遇背叛就會一直合作。第n輪甲合作，乙背叛了，乙收益3；在第n+1輪，甲報復乙，選擇背叛，乙無論如何選擇，收益最高為0；兩輪收益相加總和為3+0=3。第n輪甲合作，乙也選擇合作，乙收益2；由於甲沒有遭到背叛，所以第n+1輪甲會選合作，乙也選合作，收益2,；兩輪收益相加總和為2+2=4。乙背叛甲的兩輪收益總和為3，乙一直與甲合作兩輪收益總和為4，3＜4，因此比起背叛，乙更願意跟甲合作。

現在給定甲永遠不會實施報復，即，無論在第n輪乙採用什麼策略，甲在第n+1輪依舊會選合作。第n輪，甲合作，乙合作，乙收益2；第二輪甲合作，乙合作，乙收益2；兩輪相加，乙總共收益4。第n輪甲合作，乙背叛，乙收益3；第n+1輪甲合作，乙背叛，乙收益3；乙兩輪收益相加總和為6。4＜6，跟兩輪合作相比，兩輪背叛收益更高。實際上，我們還可以組成其他的策略組合，但是，只要甲永遠選擇合作，乙永遠選擇背叛所得的收益一定是最高的。因此，在甲不會報復的情況下，乙最佳選擇永遠是背叛，甲就永遠無法得到合作收益。

報復提高了背叛者的背叛成本，使背叛的收益小於合作，從而激勵了人們履行合作契約。報復讓自己更安全。當乙認為甲會對背叛行為進行報復的可能性越高的時候，就越不願意背叛甲，反之，乙認為甲會對背叛行為進行報復的可能性越低，就越願意背叛甲。

乙如何判斷甲對背叛行為的進行報復的可能性？看他曾經報復的頻率！曾經實施報復的頻率越高，就說明未來會實施報復的概率也就越高；曾經實施報復的頻率越低，就說明未來會實施報復的概率也就越低。

甲每一次的報復或不報復的決定，都關係著未來博弈中遭遇背叛的可能性。對這一次背叛行為實施了報復，在未來遭遇背叛的可能性就越低，未來合作收益也就越高；不對這一次背叛行為實施報復，在未來遭遇背叛的可能性就越高，未來合作收益也就越低。

為了降低未來博弈中博弈對手的背叛激勵，獲得盡可能多的未來收益，一定要盡可能對每一次背叛行為進行報復！

當孫權派呂蒙趁虛而入，佔領南郡，導致關羽身死時，他就應該料想到，劉備絕不會善罷甘休，因為對背叛行為進行報復關係到未來。但孫權似乎並沒有想到，最起碼沒有想到劉備實施報復的嚴重性。

西元221年，劉備親自率領5萬大軍討伐孫權，發動了夷陵之戰。這一場戰役，孫權部將陸遜“火燒連營”，打得劉備幾乎全軍覆沒——孫權贏了。

有什麼嚴重後果？

孫權與劉備能夠結成聯盟，合作對抗曹操，是因為無論是孫權還是劉備，其能力都不足以完成獨自對抗曹操的目標，合作能讓雙方獲得比單幹更高的收益。只要孫權和劉備無法單獨對抗曹操這一現實不變，雙方合作獲得的收益就會大於單幹獲得的收益。這個博弈的期限是“無限”的——不知道在未來的什麼時候會結束。這也就意味著，這個未來可能很長（從實際情況看，這個未來確實很長），未來越長，雙方就可以從未來的合作中獲得越豐厚的回報。

合作雙方的能力越強，大概率來說，合作收益就會越高。如果一方的能力受到削弱，不僅僅影響到這一方的收益，還會讓另一方的合作收益也減少。

呂蒙“白衣渡江”之前，劉備定軍山之戰斬殺夏侯淵，從曹操手中奪取漢中；襄樊之戰，關羽水淹七軍，斬殺龐德，生擒於禁，圍困襄陽、樊城，逼得曹操考慮遷都以避鋒芒。這些軍事行動給曹操帶來了嚴重的、真實的威脅，曹操必然需要增加力量對來應對劉備一方的行動。對劉備一方增加力量，就意味著沒有更多力量應對孫權一方，即使孫權無力發起對曹操的進攻，自身的防禦壓力總歸會減少，這就提高了孫權一方的收益。

夷陵之戰中劉備損失慘重，導致蜀漢被削弱。蜀漢的衰弱，使曹操可以減少針對蜀漢的力量，將這些力量投入到針對東吳一方。蜀漢的削弱，不僅僅降低了蜀漢獲取收益的能力，同時也降低了東吳獲取收益的能力。

每一輪博弈的合作收益都降低了，那麼未來博弈的輪次越多，也就是未來越長，損失的收益也就越多。

看似襄樊之戰和夷陵之戰孫權都是最後的勝利者，但實際上孫權一方為了眼前的收益，放棄了許許多多未來收益。“白衣渡江”之前，孫劉聯盟給曹魏的帶來了巨大壓力，但是在“白衣渡江”之後，這一聯盟再也沒能對曹魏集團形成實質性的威脅，只是勉強維持不被消滅而已。

那什麼時候應該選擇背叛呢？很明顯，沒有未來的時候！越是沒有未來，就越要背叛，奪取儘量多的眼前收益。比如說曹魏眼看就要被嚴重削弱了，對抗他不需要與劉備結盟了，這時候在孫權看來，孫劉聯盟的未來大概率就要結束了，沒有那麼多未來收益可以獲得了，眼前收益大於未來收益，就應該準備採取背叛策略。

我們引入貼現率P。明天得到2收益，不如立刻得到2收益值錢，因為明天會出現很多意外導致你無法得到這2收益，貼現率就是明天依舊會得到2收益的概率，也可以理解成明天的2收益比幾天的2收益貶值的比率。

若第n輪甲方遭遇乙方背叛，在以後的博弈中，甲就再也不會與乙方合作，則乙方的收益為第n輪背叛的收益3，加以後的無窮個0，最終為3。乙一直與甲合作的收益是第n輪的收益2，加上n+1輪的收益2P，加上n+2輪的收益2P²，加上n+3輪的收益2P³……就是無窮多個2相加。若乙該背叛甲，說明背叛收益高於一直合作的收益，則3＞2+2P+2P²+2P³……，求得P小於1/3時，滿足不等式。當下一輪博弈依舊會繼續的概率不小於1/3時，乙背叛甲的收益就小於一直與甲合作的收益，乙就不該背叛；只有預期博弈繼續的概率小於1/3時，乙背叛甲的收益才會大於繼續與甲合作，乙應該背叛甲。

背叛或者合作，與貼現率的大小有關！

這就是為什麼說孫權趁機奪取南郡是一個愚蠢的短視行為，因為在當時的情況看來，曹魏集團會在很長一段時間裡保持最強者地位，這就說明孫劉聯盟合作的貼現率是比較大的，而貼現率大時，選擇合作才是收益最高的策略。

夷陵之戰之後，諸葛亮主持了蜀漢與東吳的重新談判，再一次讓雙方回到了合作的策略上，為什麼蜀漢會願意重新與東吳合作呢？理由是——預期的貼現率特別大。

第n輪甲遭遇乙背叛，乙收益3，n+1輪甲報復乙，選擇背叛，乙收益0，n+2輪甲乙重新合作，乙收益2P²，n+3輪收益2P³……乙一直與甲合作，第n輪收益2，n+1輪收益2P，n+2輪收益2P²，n+3輪收益2P³……滿足背叛收益小於合作，則滿足3≤2+2P，求得P≥1/2。

當貼現率足夠大時，在一輪背叛與一輪報復後，乙與甲合作的未來收益依舊足夠大，乙沒有繼續背叛的激勵，因此甲在報復後，與乙繼續合作可以獲得更多收益。

因為蜀漢和東吳都承認貼現率確實是比較大的，也就是說，雙方合作才能對抗曹魏的現實會延續很長時間，所以雙方才願意重新達成合作關係。

劉備發動夷陵之戰是對的，因為報復是必須的；諸葛亮在夷陵之戰後重新與東吳結成聯盟也是對的，因為需要與東吳合作才能對抗曹魏；但是孫權在關羽北伐曹操的時候偷襲南郡卻是錯的，在貼現率明顯很高的情況下採用了背叛策略，是為了眼前的蠅頭小利放棄了巨大的未來收益，是非常不明智的。

這是可以用數理證明的。

孫劉聯盟的頹勢看起來是從夷陵之戰開始的，實際上在呂蒙“白衣渡江”之時，歷史的天平已經開始傾斜了。劉備死後，諸葛亮主持了蜀漢與東吳的重新談判，又達成了合作關係，但是，勢已成，不可逆，結局已經寫就，回天乏力了。

作者：第五大洋，歷史百家爭鳴特約作者