國立高雄大學統計學研究所
最新消息 本所簡介 師資介紹 開設課程 教師成果 學生表現 學術演講 入學管道 學生園地 心在南方 表格下載 活動集錦 網路資源 關於我們
本站首頁 本校首頁 英文版
:::心在南方  
主題:23 大數法則
發表者:黃文璋 Email:huangwj@nuk.edu.tw 日期:2014/10/23 下午 12:50:42

朋友拿著一枚銅板來問你,有人說這個“銅板公正”,那是什麼意思?當然是指它出現正面的機率為1/2,你覺得這有什麼好問的。那怎知機率為1/2?朋友追問。喔!學過一些機率理論的你頓時精神來了,能有機會發揮所學。“若依古典機率,假設銅板為公正,…,你感到不對勁停住了。他原本便是問銅板公正”之意義,怎好以假設銅板為公正”來解釋?換個說法。這是主觀機率因銅板是中央銀行發行的,所以相信製出來的不會偏差。”嗯!這樣回答也不好,彷彿是說相信就對了,不必多問,顯然不太科學。以機率空間來解釋如何?在這裡大約也不行。因銅板明明正在朋友手上,不是虛擬,因此怎能說假設有個樣本空間,其中有兩個元素正面與反面,令正面及反面的機率皆為1/2?若這樣回答恐怕再無人會來找你請教機率問題了。那只剩一招了,即用相對頻率來解釋。

持續投擲銅板n次,記錄出現的正面數,假設是Sn,則相對頻率Sn/n,便是銅板出現正面的機率。若Sn/n=1/2,則銅板便為公正,你這樣告訴朋友。還強調出現的正面數,與投擲數n有關,所以才寫成Sn。朋友依你的說明,一擲之下不是正面便是反面,因此相對頻率不是1便是0。朋友感到狐疑,不可能得到1/2啊?不能只投擲1次,你趕緊補充。但投擲兩次也不行因就算銅板的確公正,則投擲兩次,有1/4的機率分別會得02個正面,而有1/2的機率會得1個正面。因此Sn/n可能是01/2,及1,機率各為1/41/2,及1/4Sn/n不必然等於1/2。事實上,若投擲奇數次,則Sn/n不可能等於1/2,因Sn根本不會等於不是整數的n/2;而若投擲偶數次,Sn/n取的值可能為01/n2/n,…,(n-1)/n1,且隨著n的增大,Sn/n會是1/2的機率,似乎愈來愈小。例如,n=4時,Sn/n=1/2的機率為C(4,2)/24=3/8n=6時,Sn/n=1/2的機率為C(6,3)/26=5/16n=8時,Sn/n=1/2的機率為C(8,4)/28=35/128。由1/23/85/16,到35/128,的確愈來愈小。投擲次數(指偶數次)愈多,Sn/n愈不容易等於1/2。朋友因此更狐疑了,相對頻率真能解釋機率嗎?你的信心也有點動搖了,看來自己並沒弄懂頻率對機率的解釋。

如黃文璋(2013)一文所指出,有些人對未來的無法掌握充滿不安全感。因此視不確定性若蛇蠍,避之唯恐不及只是在這充滿不確定性的世界裡,怎能要求每件事都必然會如何?但幸好有大數法則及中央極限定理,這兩個重要的隨機法則,使得在不確定性中,仍有若干能確定的事。底下我們來介紹大數法則,它又稱大數率,或平均法則(law of averages)

一般人會有個印象,就是樣本愈多便愈準確,這大致是對的。只是準確的意義,卻不見得容易理解透澈。要知與數學裡不同,對隨機現象,準確絕不能詮釋成等於。如前所述對一公正銅板,投擲數n愈大,則出現正面的相對頻率Sn/n(注意Sn為一隨機變數,取值可能為01n),並不會愈容易(即機率不會愈大)等於1/2,甚至等於1/2的機率還隨著n之增大而減小。那相對頻率如何能解釋機率呢?

以相對頻率來解釋銅板公正的意義,如果簡單講,就是n很大時,Sn/n落在1/2附近一很小範圍內之機率很大。至於機率很大,即機率很接近1。有人會以較專業的方式來描述,即Sn/n接近1/2的機率,隨著n之無止境地增大,將趨近至1。而所謂n無止境地增大”,就是n趨近至無限大所謂Sn/n接近1/2,意思是Sn/n1/2的差距,不超過一固定(但可任意小)的正數,如0.010.00110-10等,要多小都無妨。整個來說,就是說對一個任意給的正數a,機率P( |Sn/n-1/2| < a),隨著n之趨近至無限大將趨近至1。無限大的符號,我們表之。

自古以來,人們常針對某特定事件,留意是否發生。如某君是否考上進士、媳婦是否生男孩等。至於其他人考上與否?其他婦女生男孩或女孩?並不在意。即使在賭戲裡也是如此,如投擲銅板是否能連續3次出現正面、玩撲克牌是否能拿到黑桃K等。這等同於關心只有兩個結果的試驗:若A表某有興趣的事件,則A發生是一個結果,A不發生是另一個結果。並不在乎發生的是BC,…,這些全歸入A不發生。有些事件是能重複觀測的,特別是在賭戲裡。假設事件A能重複觀測。人們習於數值化,不妨以Xi=1,表第i次觀測,事件A發生Xi=0,表第i次觀測,事件A未發生如此便得到一串有0,有1的數列。若A發生的機率假設是p,則每一Xi=1的機率,便是p。我們又假設這些觀測相互獨立,也就是各次觀測結果互不影響。則這樣子得到的獨立且會是1的機率皆相同的01數列,便稱為一伯努力數列(Bernoulli sequence),這是因瑞士數學家伯努力(Jacob Bernoulli1654-1705)最早探討而得名。至於一個只有兩種結果的試驗,便稱一伯努力試驗(Bernoulli trail)。我們可說每天從早到晚,不時在面對伯努力試驗,如能否趕上公車、火車會不會誤點、考試能否及格等。可看出X1+X2++Xn就是n次觀測後,事件A發生的總次數。這如同投票結束,計票時會畫“正”,某君得一票便畫一橫或一豎(對應Xi=1),沒得便不畫(對應Xi=0)。再度,由排列組合知,X1+X2++Xn,有參數np的二項份佈。至於(X1+X2++Xn)/n(在統計裡稱此量為X1,…,Xn的樣本平均(sample mean)),便是事件A發生的相對頻率。

伯努力一家,在數學史上,可說是赫赫有名。家大業大在三代裡,至少出了8位致力於數學、機率,或統計的研究者且其中有5位相當傑出。對歐美人物,我們習於只以姓稱之在數學、機率及統計這幾個領域裡,常會出現以Bernoulli為名的定理或公式,且產生的年代,橫跨很長的時間。並非他那麼長壽,且學問真的那麼無所不包,而可能是家族中不同的人。在機率與統計領域,有一伯努力協會(Bernoulli Society)的國際性組織,也有學術期刊名為Bernoulli,可見伯努力家族在機率與統計界,擁有崇高的地位。

昔日學者做學問,孜孜不倦地專研,主要是興趣,格物致知。雖藉著滿腹經綸,是可能獲得若干功名,但那應是次要。那時大抵也沒有“不出版,就完蛋”(Publish or perish)的顧慮。因此學者不像今日,須急急如律令,只要有一點研究成果,便趕著去發表。前面提到那位伯努力家族的大家長,於死後8年,1713年,他姪兒尼可拉斯伯努力(Nicholas Bernoulli1687-1759),才替他出版那本差不多可說是機率史上的第一本書“Ars Conjectandi(原文為拉丁文,英文書名為“The Art of Conjecturing”,中文有稱“占卜的藝術”、“猜測的藝術”,也有稱“猜度術”等。這本三百多年前出版的書,歷久不衰,英文版至今即使在台灣亦可買到)。在這本書中,伯努力證明了一個以他命名的定理,那就是劃時代的伯努力法則(Bernoulli law)

獨立且重複觀測一發生機率為p之事件A,當觀測次數趨近至,事件A發生之相對頻率,接近p之機率,將趨近至1

可看出p=1/2,便對應銅板公正的例子。而這便是銅板公正的意義。

伯努力法則有什麼了不起呢?對一給定的正數a,伯努力先表示出機率P( |Sn/n-p| < a),其中如前所述,Sn=X1+X2++Xn,有參數np的二項份佈。這得先解個不等式,看那些正整數k滿足|k/n-p|。然後把那些滿足上述不等式的k,所對應二項分佈之機率

P(Sn=k)=C(n,k)pk(1-p)n-k

相加。再辛苦地證明當n趨近至∞時,那些機率P(Sn=k)之和趨近至1。以伯努力所處數學工具那麼少的時代,那真是一有如往昔建金字塔之大工程。後人利用著名的柴比雪夫不等式(Chebyshev inequalityPafnuty L. Chebyshev1821-1894,為俄國著名數學家),可輕易證出比伯努力更一般的結果。但科學的發展過程中,向來是第一位發現者,貢獻最大。

三百多年來,伯努力法則一再被推廣。像是只要X1X2,…Xn,…是一數列獨立且有共同分佈的隨機變數,又設其期望值μ存在。則當n趨近至,樣本平均(X1+X2++Xn)/n接近μ之機率,將趨近至1。若用機率的術語來說,就是獨立且有共同分佈的隨機變數,當樣本數趨近至,其樣本平均會機率收斂至期望值。而這只是弱大數法則(weak law of large numbers),還有強大數法則(strong law of large numbers)。甚至尚有許多不同版本的大數法則。若欲深入了解大數法則,可參考黃文璋(2010)

相信讀者已能區分大數法則與巨數法則了,雖都涉及大數,但乃完全不同的兩個法則。網路路上有篇文章中有底下一句:

保險業流行一條大數法則意思是只要大量接觸客人,十位或一百位,總有一位客人投保。

其實這乃巨數法則。假設關心某一發生機率p很小之事件。巨數法則只能指出,一旦樣本數n夠大,此事件發生便不稀奇。大數法則卻能更進一步,指出n夠大時,此事件發生的相對頻率Sn/n有很大的機率很接近p。亦即此事件大約發生np次左右。可以這麼說,大數法則是一比巨數法則精準許多的法則。

大數法則可以支持頻率對機率的解釋。雖有些難度,但既然不少人將大數法則琅琅上口,因此是有必要對它多些了解。

參考文獻

1. 黃文璋(2010). 機率論, 第二版. 華泰文化事業股份有限公司, 台北市.

2. 黃文璋(2013). 談不確定性. 黃家小館(http://huang.nuk.edu.tw/cindex.htm).

   暫無回應
 回本區首頁 
  回應總數0  
 
 
  下一頁  
  
 
我要回應
姓 名: 回應前,請先註冊登入
E-mail:
內 容:
驗證碼:  (CT2U
 
 
:::
 
*

地  址:811高雄市楠梓區高雄大學路700號
電  話:07-5919362 傳真:07-5919360 e-mail: stat@nuk.edu.tw
更新日期:2024/4/11 上午 09:16:10

2003/10/20起第 9056555 位訪客
*