回合制遊戲的先手優勢有哪些平衡手段？

本文來自知乎問題“關於回合制遊戲的先手優勢有哪些平衡手段？”下的回答，作者Xylitogum，遊戲葡萄已獲轉載授權。

首先上很多人知道的策梅洛定理：

任何透明的、確定性的雙人有限遊戲，定有一方存在必不敗的策略。

一般地，為了保證玩家的遊戲體驗，回合制遊戲中玩家的行為本身應當與“優勢”有直接關聯，遊戲目標也經常是兩類顯性的目標：“率先達成目標”或者“儘量多得分”，或者兩者的混合。

率先達成目標：(舉例)

先把對面的生命打到零。

先湊足五個子。

先賺他一個億。

儘量多得分：(舉例)

規定時間內儘量多打倒對方。

在局數耗盡前多賺錢。

在雙方無處可下之前，儘量多占地盤（圍棋）。

因此第一個進行行動的玩家在絕大多數時候也意味著第一個得到優勢，而在上述環境裡，很容易就變成先手必勝(或不敗)的遊戲。當然世界上也存在後手必勝的遊戲，比如“石頭-剪刀-布”變成先後手回合制，

比如特定堆數組合的Nim遊戲（輪流從堆中拿走棋子/火柴，直到有一方無子可拿）。

(三堆火柴組成的Nim遊戲)

確切地說，我個人會將回合制遊戲分為“行動主導”和“反制主導”，來區分這兩類遊戲。

行動主導：

玩家的行動回合本身被視為遊戲中珍貴的核心資源。

玩家可以執行的行動中絕大多數都會直接往遊戲目標靠近，並且很多時候可以直接量化。（局部最優解與全域最優解很接近，因此允許“貪心法”簡化決策空間。）

允許Strategy-stealing，也就是先手可以在第一輪進行明顯帶有優勢的行動，然後複製後手的必勝策略（如果存在），因此普遍存在先手優勢。

反制主導：

玩家根據對手前一行動的策略來進行互動和反制，對遊戲目標有決定性的作用。

相比之下，玩家執行的行動未必對勝利都有貢獻，有時反而會幫倒忙。（局部最優解與全域最優解關聯不高）

可以從先行者的策略中做出針對，或者從先行者身上學習失敗經驗，因此許多情況下存在後手優勢。

過於強調反制主導的遊戲有個致命缺陷，

就是即時的回饋不夠直觀，玩家難以在每一步行動中都找到樂趣（或者說，選擇意義的缺失），容易破壞“心流”。所以它們的普遍受眾比較小，因此現在市面上的例子還是行動主導的為主。

要平衡一個行動主導的回合制遊戲中先手優勢的影響，可以從數值、機制等等各個角度出發來尋找可行的方案。下面分析一些值得參考的方向和思路，結合實際情況來服用。

思路一：“讓數字說話”

減少初始資源與選擇空間：

基於卡牌的回合制遊戲，許多時候手牌的數量意味著選擇的空間和握有的潛在戰鬥力總和，本身也是一種資源。因此諸如三國殺，爐石傳說在內的卡牌遊戲會讓後手在遊戲前期的手牌上佔有優勢，

以此來對沖先手的優勢。

同樣地，你可以通過調整初始血量，初始金幣，初始移動點數等等資源配比來避免先手有著顯著的遊戲，甚至還可以在先手的計分方式和獲勝方式上做出懲罰。

計分懲罰：

這種方法與減少初始資源有著異曲同工的地方，對應的多數也是量化得分的遊戲類型。傳承千年的經典遊戲——圍棋，在現代就是使用“貼目”制度（具體數量各地區略有出入），讓執黑先行的選手必須比對手多占一部分地盤才能獲得本局勝利，來保證先後手的勝率在總體上保持平衡。（如果圍棋不貼目，那麼黑棋可以通過第一手下天元然後下模仿棋，這樣白棋必須製造征子否則無法破解。）

但這種做法有個最顯然的問題：你怎麼知道具體該懲罰多少分？拍腦門嗎？

除此之外還要注意的是，純粹的量化懲罰與隱式設計(Implicit Game Design)理念有一定衝突，刻意製造了設計師的存在感，讓玩家感覺把遊戲天平完全建立在了設計師拿捏的一個數值上。這樣的規則也會讓玩家帶著壓力開始對局並創造不對稱性，破壞整體美感。更好的做法是讓兩邊玩家都清楚自己的初始優勢在哪，是多了先行的機會，還是多了選擇的空間？

思路二： “行動不是全部”

讓先手需要外部資源投入：

帶有大量養成玩法的回合制對戰遊戲中（如Pokemon），許多時候會引入一個“速度”概念，來決定誰會獲得先手。這個速度屬性是一個特殊的，winner-takes-all的屬性，大多數情況下同時也會佔用養成的資源，這意味著玩家必須自己做出策略上的選擇，是先手給我帶來的優勢重要，還是讓其他硬屬性高一些來得重要？這是一種極具趣味，且經過驗證可行的玩法，同時也會根據資源比重不同引出一條互相克制的反制鏈來，與博弈論中“上校賽局”(Blotto Game)相當接近。

(Pokemon中追求速度與否的爭辯從未停止)

但是它也有著局限性。“速度”概念是需要外部資源投入的，也就是說必須和外部的養成之類的玩法結合，很難有辦法在單局中實現平衡，同時也無法在對稱性遊戲中實現。畢竟遊戲設計上沒有完美的事不是麼？

增加反制玩法：

上面提到的反制主導的遊戲中，有許多是後手具有顯著優勢的。其原因就是這類遊戲中存在策略的相互克制，使得後手方可以學習先手方的策略，並做出針對性的調整來取得優勢。那如果把行動主導和反制主導的思想結合起來，讓兩邊都沒法占到便宜呢？

在Dota 2職業比賽的英雄選擇環節，就使用了類似的做法。雙方按2-2-1的次序輪流禁用(ban)特定英雄和選擇(pick)特定英雄，如下圖：

(從左往右，綠色表示綠方行動回合，紅色表示紅方行動回合，Ban表示禁用英雄，Pick表示選擇英雄)

當然，假設英雄之間只存在絕對的強度差異，那麼ban-pick順序無論怎麼調整，先選的一方總是有利的。但Dota 2巧妙的英雄設計讓玩家在選擇英雄時不僅要考慮強度差異，還有英雄之間的專長協作與克制關係，以及雙方對英雄的熟悉程度不同，都會影響ban-pick時的選擇。這樣一來，職業比賽英雄選擇部分就不再是純粹的先手或運氣成分主導，讓比賽的觀賞性在賽前英雄選擇時就得到了充分的渲染。

思路三：“讓遊戲變得不確定”

隨機性：

與資訊不透明度的思路一樣，在遊戲中引入隨機性可以增加結果的不可預測性，從而降低其與玩家初始先後手狀態的關聯。但隨機性也是一針毒藥，用多了會讓遊戲單純變成運氣，大幅降低遊戲策略帶來的樂趣。要記住的是，隨機性本身並不一定會改變遊戲的對稱性，但它可以沖淡因對稱性帶來的一邊倒的最優解選擇，給最優解的執行帶來一定的障礙。

(一個標準卡坦島遊戲的棋盤)

在風靡世界的桌面殖民地建設遊戲《卡坦島》(Settlers of Catan)中，通過投擲兩個骰子的點數之和來決定哪些玩家得以獲取資源。同時初始兩個基地的放置也是按照從前到後再從後到前的順序，避免先行玩家對優秀資源點的壟斷控制。

另一個提到隨機性便不得不說的例子就是《爐石傳說》。在爐石中從抽牌到效果發動無時無刻不充斥著隨機結果的影響， n抽3再3選1的發現機制也是隨機性與決策的結合，更有甚者如尤格薩隆，一張牌隨機性的表現在極端情況下便可直接左右比賽的勝負。

在這樣的遊戲中，隨機性使遊戲充滿了變數，使後手玩家相信先手優勢並不可怕，也使每局遊戲玩家都有期待。但一如之前所言，過分的隨機性會讓玩家失去自主感，讓遊戲的成敗變為聽天由命的焦慮過程，需要好好把握；另外隨機性與反制鏈的結合不當，也會讓遊戲變成石頭剪刀布那樣純粹開局定勝負的遊戲。

挖掘遊戲深度：

策梅洛定理假設雙方都是“完美的玩家”，但在實際遊戲中，先手優勢的大小不僅取決於其潛在收益，還得考慮玩傢俱體能做到多少。這裡遊戲“深度”一詞指得便是技能上的深度，尤其是指即使最優解存在，人類因技能限制也無法達成完美的情況。

舉個例子，足球籃球等體育比賽有先手優勢嗎？足球也是確定性的，資訊透明的遊戲，但沒有人能保證自己能完美控制自己的身體（當然經過訓練可以得到提升），球權的更迭很頻繁。雙方很多時候較量的就是這種身體控制能力，而先獲得球權的優勢雖然存在，但絕大多數時候並不足以扭轉比賽的天平---更何況在半場過後會輪換到另一隊開球。

同樣地，在國際象棋中，先手的白棋也普遍有著2%-5%的勝率優勢。但由於決策樹的深度和複雜度，國際象棋先手必勝與否目前還是處於猜想階段，更別提讓人腦去思考和執行了。所以哪怕對先手優勢完全沒有實質性的平衡手段，國際象棋的平衡也處於玩家普遍可接受的範圍內。

(一個X方先行的井字棋遊戲的完美平局)

反過來說，深度過淺的遊戲先手優勢會被放大。比如Tic-tac-toe（井字棋）遊戲，因為深度太淺且無隨機性，很容易被大多數玩家找到最優解且容易實現。在這種情況下，先手優勢不僅很大，而且很容易找到並實現不敗策略，因此現在在成年人之間的娛樂對弈活動幾乎完全不會考慮井字棋。

延續遊戲長度：

某些時候，你已無法直接對遊戲規則進行大刀闊斧的改革了，那你怎麼進一步對先手優勢進行限制呢？

一個辦法就是，讓大家輪流坐莊，在一定局數之後再判定總體勝負，如同斯諾克比賽那樣要打十幾局乃至三十幾局來決出勝負。這樣既可以降低隨機性對結果的影響，又可以讓先手優勢得到壓縮。然而缺點是會嚴重放慢遊戲節奏，同時依舊無法對單局比賽的體驗產生影響。

除此之外，還能拉長單局遊戲的長度，像文明系列那樣一局能打幾百個回合，讓遊戲中後期沖淡前期先手的影響（至少是心理影響）。但同樣會嚴重放慢遊戲節奏，對不確定性較低的遊戲而言還不一定會起到削弱先手的效果。

信息不透明度：

同樣是可以用紙筆進行的回合制遊戲，帶有資訊不透明度的Battleship的先手優勢就完全不如Tic-tac-toe那麼誇張（但是依舊存在）。在Battleship中，由於雙方自身的海域佈局對對手不可見，玩家需要輪流猜測敵船的擺放位置來進行炮擊的選擇。

(一個10x10的常見Battleship棋盤，用x標記炮擊位置)

顯然，如果把Battleship的海域佈局改成對雙方完全公開的形式，那麼這遊戲的先手就會變成必勝——先手能先把對方船轟完。但考慮到實際上初始階段玩家只有大約1/3的概率命中有效目標（事實上與引入了隨機性等價），先手就並不能保證對先行優勢的轉化，只有少數極端情況下先手正好比後手快一步擊潰對手才會體現出優勢。而這個可以通過一個小小的規則修改來避免，並達成完美對稱性：

先手擊沉敵人所有船隻後，還會允許後手再進行一次炮擊；如果後手也因此擊沉了敵人所有的船隻，則該局計為平局。