貝葉斯定理：我們幾乎每天都在使用的數學工具

我們的世界觀和因其導致的行為往往是由一個簡單的定理促成的，在150多年前，這個定理由一位性格內向的英國數學家和神學家湯瑪斯·貝葉斯（Thomas Bayes）悄悄設計，直到他去世後才將其發表。

貝葉斯定理最著名的運用之一是在二戰期間被用來破解納粹的恩尼格碼密碼。如今，該定理更是廣泛深入的被運用在科學、技術、醫學等領域。

但什麼是貝葉斯定理？它又是如何運作的呢？

貝葉斯定理

湯瑪斯·貝葉斯的洞察力非常簡明。一個假設是真實的概率取決於兩個標準：

根據當前的知識（“先驗”），判斷它的合理程度；

評估它與新的證據的契合程度。

然而，在貝葉斯去世後的100多年裡，科學家通常僅通過對新的證據來評估他們提出的假設。這是我們大多數人在科學課上受到的傳統的假設-檢驗(頻率論者)方法的教育。當一個不合理的解釋與一個新的證據完美契合時，貝葉斯定理和頻率論者的方法之間的區別尤為明顯。

讓我們先來製造一個假設：

“月亮是用乳酪做的！”

接著，我們仰望星空，並收集相關的新證據，並發現月亮的顏色是乳酪黃。在傳統的假設-檢驗框架中，我們會得出新的證據與我們天馬行空的假設相符的結論，從而增加了我們對該假設的信心。

但如果使用貝葉斯定理，就會得到更加謹慎的結論。我們會意識到雖然這個假設符合新的證據，但這個想法從一開始便極其荒唐，它違背了我們對宇宙學和礦物學所熟識的一切知識。因此，月球是乳酪的綜合概率（即這兩項評估的乘積）依舊是很低的。

當然，這只是一個極端的例子。沒有哪位正經科學家會試圖檢驗這樣一個荒誕的假設。但是，全球科學家們總在不斷評估大量的假設，而其中一些假設是相當牽強的。

例如， 2010年有一項研究最初表明：

“持有溫和政治觀點的人可以看到更多的灰色。 ”

後來這個假設在進一步檢驗後被駁回，研究人員認識到這是不可信的。然而幾乎可以肯定的是，有許多類似的研究已被草率的接受。

生活中的貝葉斯方法

運用先前的經驗和記憶中積累的知識、和意識中提煉出的新證據，我們對日常事物的概率進行分配和生活進行管理。

舉一個生活中的簡單事件：接聽手機。

通常在工作時你將它放在辦公桌上，而在家裡時把它放在在充電器上。現在你在家裡的小花園裡澆花，聽到屋內電話聲響起。新的資料會告訴你它處於室內任何地方，但你仍會直接走向充電器。因為你將的先前對手機位置的認知（通常在辦公桌上或家中的充電器上）與新的證據（房屋的某處）相結合，從而確定了它的位置。

如果手機不在充電器上，那麼你會喚起先前你在某些放置過手機的位置的認知來縮小搜索範圍。你會忽略房子裡大部分的地方，如冰箱、襪子抽屜等等，因為這些地方在你先前所積累的認知中被認定為極不可能的位置，你會在最終找到電話之前思考最可能的地方。

而在這個找電話的過程中，你便正在使用貝葉斯定理。

認知和證據

貝葉斯推理的一個特徵是：當資料較弱時，那麼先前對事物的認知是最重要的。這個原則一直被我們直覺性地使用。

例如，你在酒吧玩飛鏢，附近的陌生人說他(她)是專業的飛鏢選手，那麼一開始你很可能會假設這個人在開玩笑。

你對這個陌生人一無所知，但你知道遇到一個真正的專業飛鏢選手的幾率很小。比如在澳大利亞，專業的飛鏢選手只有大約15名。假如他扔了一隻飛鏢正中靶心，你可能還是不會相信他的說法，因為這可能只是走運的成分。但如果他連續十次都擊中靶心，你會更傾向於接受他是專業人士的說法。因為隨著新證據的積累，你之前的認知被超越。貝葉斯定理再次起到作用。

一個統管它們的理論

現在，貝葉斯推理支撐著廣泛的人類調查領域，從癌症篩查到全球變暖，從遺傳學到貨幣政策等等等等。

例如，貝葉斯推理是風險評估和保險行業的基礎。每次颶風或洪水襲擊一個地區時，保險費都會飛漲。為什麼？

量化風險是一件非常複雜的事情，而且目前的條件不足以對未來可能發生的災難提供足夠多的資訊。因此，保險公司會根據現時情況並結合過往發生的情況來估算風險。每當自然災害發生一次時，他們就對該地區的資訊進行更新，預計未來索賠的可能性將更大，因此提高保險費。

在醫學診斷中，貝葉斯推理也同樣發揮著重要作用。一個症狀（新證據）可以是多種可能的疾病（假設）的結果，但不同的疾病對於不同的人來說具有不同的先驗概率。而線上醫療工具無法將個人的先驗概率恰當的考慮在內，這也正是線上醫療的主要問題。它們對你的個人歷史知之甚少，因此會忽略一系列可能的疾病。

貝葉斯定理再次告訴我們：向一位瞭解你之前病史的醫生求診，能獲得更高效合理的診斷。

阿蘭•圖靈和恩尼格碼

貝葉斯方法能讓我們從模糊的資料中提取準確的資訊，從無限可能性的範圍中找出更有針對性的解決方案。

這也是阿蘭•圖靈當年破解德國恩尼格碼的核心，它加速了二戰的結束，挽救了數百萬人的生命，對全世界都意義非凡。若是要在無數的潛在翻譯下進行搜索是不可能破譯一組加密的德文資訊的，尤其是恩尼格碼通過不同的轉子設置每天變化。

圖靈關鍵的貝葉斯洞察力是一些特定資訊比其他資訊更有可能，這些可能的解決方案都是基於以前的成功破譯的資訊和符合邏輯的期望。例如，德國的U型潛艇的資訊可能包含與天氣或盟軍航運相關的短語。

類似這樣的先驗資訊極大地縮小了可能需要評估的翻譯數量，使得圖靈的密碼破譯機能以超過日常變化的速度快速破解恩尼格碼。

貝葉斯和進化

為什麼我們對貝葉斯方法如此感興趣？在大多數科學領域中，比如進化生物學，貝葉斯方法扮演著越來越重要的角色。通過預測氣候變化所帶來的影響，來分析傳染病的傳播，生物學家通常從廣泛的可能性中尋找一些合理的解決方案。

在進化生物學的研究中，主要涉及重建生命的歷史和演化過程，這些方法可以幫助我們從數十億種可能的分支模式中找到的正確進化樹。

無論在工作還是日常生活中，貝葉斯方法可以幫助我們從巨大的乾草堆中找到一枚小針頭。

貝葉斯推論的黑暗面

當然，如果先驗資訊被錯誤地應用在貝葉斯推理上，那麼問題就產生了。在法庭上，這可能導致嚴重的審判不公。英國就曾發生過這樣一個著名的案例，薩莉·克拉克在1999年被誤判為是她謀殺了她的兩個孩子。

公訴人認為，兩個嬰兒都自然死亡的可能性是極低的（僅7300萬分之1），因此斷定是她殺死了他們。

但是他們沒有考慮到一個母親殺死自己的孩子的可能性也是非常低的。因此，她完全無辜的可能性與是雙重兇手的可能性比公訴人起先認為得要更相近。

克拉克在後來的上訴中，上訴法院的法官批評在原審中所用到的統計學。

這突出說明了對貝葉斯定理缺乏理解會產生多麼深遠的影響。但是，在具備正當合理的先驗條件下，貝葉斯方法可以提供從其他管道中無法獲得的見解。

撰文：Mike Lee（澳大利亞福林德斯大學進化生物學教授）、Benedict King（澳大利亞福林德斯大學古生物學脊椎動物博士生）

譯：萌大統領

原文連結：https://theconversation.com/bayes-theorem-the-maths-tool-we-probably-use-every-day-but-what-is-it-76140

原理”（ID：principia1687）授權轉載

編輯：yangfz

近期熱門文章Top10

↓ 點擊標題即可查看 ↓

你便正在使用貝葉斯定理。