王澤斌
我們知道,開賭場幾乎沒有虧錢的。盡管有人從賭場贏了錢。但輸?shù)娜烁唷:芏嗳苏J為是賭場有“賭神”?;蛘哔€場能“出老千”。這些因素或許存在,但賭場贏錢最根本的原因在于概率的應用。換句話說,概率決定了賭場是占便宜的一方。賭客越多。賭場就越不會輸。
先來做一個游戲:如果有14張牌,其中有一張是A;現(xiàn)在我來坐莊,一塊錢賭一把,如果誰抽中了A,我賠他10塊錢,如果沒有抽中。那么他那一塊錢就輸給我了。有人賭嗎?
這樣的一個賭局,為什么說我占了便宜呢?因為在抽之前,誰也不知道能抽到什么。但是大家可以判斷抽到A的可能性要小得多。14張牌中才有一張,換句話說概率是1/14,而抽不中A的概率是13/14。概率就是這樣一個對未發(fā)生的事情會不會發(fā)生的可能性的一種預測。如果你只玩一把,當然只有兩種可能:抽中了贏10塊錢,沒抽中輸一塊錢。但是,如果你玩上幾百幾千甚至更多把呢?
這就是概率上的一個概念,叫做數(shù)學期望,可以理解成某件事情大量發(fā)生之后的平均結(jié)果?,F(xiàn)在我們來看上面的那個例子,抽中的概率是1/14。結(jié)果是贏10塊錢(+10),抽不中的概率是13/14,結(jié)果是輸1塊錢(-1)。把概率與各自的結(jié)果乘起來,然后相加,得到的“數(shù)學期望”值是(-3/14)。這就是說,如果你玩了很多很多把。平均下來,你每把會輸?shù)?3/14)塊錢。A賠13塊錢,那么數(shù)學期望值是0,你玩了很多把之后會發(fā)現(xiàn)結(jié)果最接近不輸不贏。如果抽中A賠14塊錢,那么數(shù)學期望值是1/14,對你有利,大量玩的結(jié)果是你會贏錢。但是,沒有人會這樣設賭局。
賭場的規(guī)則設計原則就是這樣,無論看起來多么誘人,賭客下注收益的數(shù)學期望都是負值,也就是說,總是對賭場有利。因為有大量的人賭,所以賭場的收支結(jié)果會很接近這個值。比如美國的輪盤賭,38個數(shù)隨機出,押中了賠你35倍。沒押中你的錢輸?shù)?。其他的賭局規(guī)則可能更復雜,但是背后的概率原理是一樣的,就是賭客的數(shù)學期望值是負數(shù)。像我們通常見到的彩票,如果所謂的返回比是55%的話,那么花一塊錢的數(shù)學期望是賠掉0.45塊。無論是賭場還是彩票,幸運兒的產(chǎn)生必定伴隨著大量獻愛心的人。
數(shù)學期望的概念是作理性決策的基礎。我們做任何一項投資,做任何一個決定,都不能只考慮最理想的結(jié)果,還要考慮到理想結(jié)果出現(xiàn)的概率和其他結(jié)果及其出現(xiàn)的概率。否則,如果只考慮最理想的結(jié)果,大家都應該從大學里退學,因為大學退學的“最理想結(jié)果”是成為比爾·蓋茨。
概率問題的關(guān)鍵是隨機性,比如扔一個硬幣,誰也無法預測是正面還是反面。同樣,擲骰子、搖獎也是。有個最搞笑的職業(yè)叫“彩評家”,號稱分析彩票號碼的規(guī)律,預測下一期最可能的號碼。電視里的“彩評”節(jié)目往往是專家侃侃而談,主持人做興致盎然崇拜狀。經(jīng)常聽到的話是“這幾個數(shù)字前兩期出現(xiàn)了,根據(jù)概率,下一期不大可能出現(xiàn)”。這可以稱之為一本正經(jīng)地胡說八道。按照概率理論,兩件不相干的事情都發(fā)生的概率是各自發(fā)生概率的乘積,所以兩件不相干的各自概率為萬分之一的事情都發(fā)生的可能性是一億分之一。但是,如果一件已經(jīng)發(fā)生了,那么另一件發(fā)生的概率還是萬分之一,跟已經(jīng)發(fā)生的事情無關(guān)。只要彩票的搖獎沒有丑聞,那么中獎數(shù)字是無法預測的。不管前幾期出現(xiàn)了什么號碼,下一期的號碼仍然是隨機的。出現(xiàn)過的數(shù)字不會避嫌,沒出現(xiàn)過的數(shù)字也不受到照顧。
據(jù)說概率是起源于賭場的學問,但是它的價值已經(jīng)遠遠超出了賭博。這里舉一個很現(xiàn)實的把概率知識轉(zhuǎn)化成經(jīng)濟效益的例子:要在人群中普查一種病,檢查方式是抽血檢測其中是否含有某種病毒,這種病在人群中的發(fā)生率比較低,比如說1%。對于這樣的一種普查,成本最高的地方是檢測血液,如果能減少血液檢測的數(shù)量,就能節(jié)約大量成本。我們很自然地想到抽每個人的血,然后檢測,這樣有多少人就驗多少份血,簡單明了。為了形象起見,假設有1000萬人,那么直接檢測的方案是測1000萬份血?,F(xiàn)在我們換一下思路,把抽來的血兩兩混合,送去檢測,如果檢測結(jié)果陰性,表明原來的兩份血都沒問題:如果結(jié)果陽性,表明至少有一份血有問題,就把兩份都重測。這樣也可以確定每個人的帶病情況。這樣做的總檢測量是多大呢?兩兩混合之后,要檢測500萬份,然后結(jié)果陽性的那些重測,大概是20萬(1000萬人的1%是10萬人帶病,導致20萬份血重測),總共檢測520萬份的樣子。實際上還有一部分陽性的樣品是混合的兩份血都帶病,這樣實際的陽性結(jié)果比10萬份還要少。總之我們看到,檢測總數(shù)幾乎減少了一半,能省很多錢了吧?如果把10份血混一起再測呢?同樣的分析,先要檢測100萬份,加上結(jié)果呈陽性的最多10萬份混合樣品重測——共100萬份原始血樣需要重測,總共最多檢測200萬份就搞定了。
在這個例子里,多少份血混在一起最劃算,取決于人群中的發(fā)病概率,跟要檢測的總?cè)藬?shù)無關(guān)。另外一個考慮因素是血樣混合之后,病毒濃度被稀釋了,是否還能被檢測出來。綜合考慮這些因素,運用概率和并不復雜的優(yōu)化計算,可以精確地算出把幾份血樣混在一起最省錢而又能完成任務。
編輯梁宇清