國立高雄大學統計學研究所
最新消息 本所簡介 師資介紹 開設課程 教師成果 學生表現 學術演講 入學管道 學生園地 心在南方 表格下載 活動集錦 網路資源 關於我們
本站首頁 本校首頁 英文版
:::心在南方  
主題:22 機率的涵義
發表者:黃文璋 Email:huangwj@nuk.edu.tw 日期:2014/10/20 下午 05:11:19

著名的天文學家及數學家,有法國牛頓之稱的拉普拉斯(Pierre-Simon, Marquis de Laplace1749-1827),對機率曾有下述看法

這門源自考慮賭博中的機運之科學必將成為人類知識中最重要的一部分,生活中最重要的問題之大部分,都將只是機率的問題。

人們常在談機率。機率究竟是什麼意思?投擲一銅板,出現正面的機率是多少?1/2。為什麼?因銅板有兩面,所以每面出現之機率都是1/2。投擲一骰子,出現點數6的機率是多少?1/6。為什麼?因骰子有6個面,所以每面出現之機率都是1/6。在上述這類例子中,我們皆以相同的可能性來解釋機率。即銅板、骰子皆是公正,所以一擲之下,各結果出現之可能性(機率),都假設相同。如此一來,看共有幾種可能的結果,則每一結果出現之機率,便為全部可能結果數的倒數

歷來機率一詞有幾個不同的涵義,以相同的可能性來解釋,便是所謂古典的機率。為何說是古典?因這種解釋方式,真的是源遠流長。在舊約聖經”“利未記第十六章記載,為那兩隻羊拈鬮,一鬮歸與耶和華,一鬮歸與阿撒瀉勤。民數記第二十六章在完成第二次人口統計後,耶和華曉諭摩西拈鬮分地給以色列的12個支派。又在新約聖經”“約翰福音”第十九章,兵丁將耶穌釘在十字架後,4人拿著耶穌的裏衣彼此說,我們不要撕開,只要拈鬮,看誰得著。不論那隻羊獻給上帝、各支派可分到那塊土地,或誰能得到耶穌的裏衣,都採用拈鬮決定,毫不偏袒。可見很早以前,們就有拈鬮(抽籤)是公平的概念,而這正是相同的可能性。

從十六世紀起,數學家開始關心諸如投擲骰子,或玩撲克牌等賭戲中的輸贏問題。在留傳至今的圖畫裡,有一幅是某小酒館中,一位數學家,專注地振筆疾書。是在證明什麼大定理嗎?仔細一瞧,原來正在解某機率題。在那個時代的賭戲中,都假設骰子製作精良,不會有偏差,撲克牌也都能洗得很均勻,所以每一可能的結果,其出現之機率,均合理地假設都相同。若要求某事件之機率,先求出全部共有幾個可能的結果,再求該事件裡,包含幾個可能的結果,後數除以前數,便得到所求之機率。可能的結果不是很多時,很容易全部列舉出來。但當可能的結果很多,便不易列舉,於是便發展出排列組合的技巧。像對426的樂透彩,欲求中頭獎之機率,要將所有5,245,786個可能的結果全部正確地列出,並不實際,必須藉助組合的公式C(42,6)。雖說古典,但這種解釋機率的方式,至今仍常被採用。如你參加一項37人報名,錄取2人的面試,若毫無資訊,很自然地,便假設你會被錄取的機率為2/37。附帶一提,對任一正整數n,及整數k=01,…,n

C(n,k)= n!/(k!(n-k)!)

其中n!=n×(n-1)××2×1,又0!=1

機率有沒有其他涵義?有的。心儀一女孩,在追她之前想先研判追上的機率。這時古典機率,恐怕便不適用了因就算沒有其他人正在或準備追她,也不能說你追上的機率便是1。仔細評估,由她平常對你的態度,加上自認擁有的條件,你覺得追上的機率有8成,那就勇往直前。只是自己信心滿滿,覺得追上易如反掌,旁人卻個個以為你追上的機率連1成也沒有。這便是主觀機率,也是一種常用的對機率之解釋方式。雖說主觀,但不表就是隨便說說,常也會依據一些客觀的資料來決定。例如,人們經常會舉頭望天,將現有的雲層,與過去經驗比照,來判斷下雨機率。只是雖人人都想儘量客觀,但每人卻可能得到不同的機率值,主觀機率一向如此。

機率還有沒有其他涵義?既然有主觀機率,便也有客觀機率,即以相對頻率來解釋機率。MLB有某場比賽到了9局下,只要再打出一支安打,後攻這方便贏了。打擊者上場,趕緊查一下,他累積的打擊率是382。看來樂觀,他能擊出安打的機率有0.382,相當不錯。打擊率是安打數/打擊數,便是一相對頻率。這樣子得到的機率,稱為客觀機率,因完全依據過去的資料,沒有夾雜任何主觀判斷。要能以相對頻率來解釋機率所針對的事件,必須能重複觀測。例如,若想估計某銅板出現正面的機率,則反覆投擲便是,銅板不會有異議。但若問追一女孩成功的機率便難有客觀機率了。因不像真愛每一天(About Time2013),片中懊惱的事,可一再重來,直至滿意為止。那畢竟是電影,真實的人生,大概沒有女孩願意讓男孩於惹怒她後,重新來一遍。

上述三種對機率的解釋,都是很直觀的。不見得須學過機率,生活裡視不同的情況,也就是看面臨什麼實際的問題,往往便能交互著運用。

還有一種解釋機率的方式,就是公理化。簡言之,就是不必有骰子、撲克牌等實境。可以在一虛擬的系統裡,稱為機率空間,其中有一樣本空間(sample space,代表一試驗所有可能結果的集合)、一些事件(每一事件皆為樣本空間的子集合)的集合,還有一機率函數(此函數對每一事件A給一機率P(A))。什麼樣的函數可當機率函數,是要有些規定的,但乃源自原有經驗。例如,樣本空間的機率為1,這很合理,因樣本空間是全部可能結果的集合,機率自然是1。另外,空集合的機率為0也很合理,空無一物,機率自然是0。機率函數還有幾個也算合理的條件,在此略過。有了機率空間,在那如電玩遊戲的系統裡,不只求機率,還能討論實際情境裡(如骰子、撲克牌等),不會想到或遇到的各種題材。要知諸如電玩遊戲、武俠小說,或科幻電影等都一樣,雖看似天馬行空,但其實往往各有一套邏輯,能自圓其說。那些邏輯,乃擷取自實際經驗,再加以擴展。因此機率空間看起來抽象,但以往每一實際碰到的機率問題,都可在某一機率空間中,找到認同。必須這樣才可以,否則就不會被認為這是機率了。這有點像本來一個個機器人的兒童玩具,後來發明了樂高(lego)積木,不但可組出機器人還可組出飛機、火車等,包羅萬象。

給一例子。取樣本空間為集合{123456},樣本空間的任一子集合都取來當做事件。諸如{13}{456}等,都是樣本空間的子集合,因此都是事件。至於樣本空間本身,及空集合,當然也都是事件依此定義,事件的集合中共有幾個元素?64個。因1234566個元素,每一有取或不取兩種可能,而26=64。對{1}{2}{3}{4}{5}{6},這幾個基本事件,各給1/6的機率,然後任一事件,如果其中有i個不同的元素,則令其機率為i/6。例如,事件{13},及{456}的機率,分別是2/6,及3/6。這便給出機率函數。有人看了說這不就是投擲骰子的例子嗎?的確可以這樣想,我們剛才已說了,過去碰到的機率問題,皆能在某一機率空間中,找到認同。只是此處的系統可以較一般,因{1}{2}{3}{4}{5}{6},不一定要各給1/6的機率,只要都在01之間,且和為1就可以了。例如,可令P({1})=0.1P({2})=0.12P({3})=0.27P({4})=0.23P({5})=0.13P({6})=0.15。給這樣的機率值,便對應不公正的骰子,是古典機率裡所沒有的。而樣本空間也亦可取為所有整數的集合,這也是古典機率裡不會有的。在古典機率裡,由於採相同的可能性來給機率,因此樣本空間裡不會有無限多個元素,否則樣本空間這一事件的機率便為無限大(只要想無限多個p相加,會等於無限大便知,其中p為一介於01間的正數),而不是1。至此讀者應已理解到,古典機率是很局限的,賭戲之外,沒有太多能施展之處。

拉普拉斯早說了,生活中最重要的問題之大部分,都只是機率的問題。因此處在隨機世界中,便至少該把機率的涵義弄清楚。想對機率進一步了解者,可參考黃文璋(2011)一文。

如同將資料數值化,有時會將樣本空間對應到實數,即對樣本空間中每一元素,給一實數值。而也如同資料的數值化,即使樣本空間原本便是實數的集合,仍可將其對應到實數。而每一個這種對應,若符合某一條件,便稱為一個隨機變數(random variable),通常以大寫的英文字母,如XYZ等表之。在同一樣本空間,可定義很多(更清楚地說有無限多個)隨機變數。一個本來簡單的機率空間,經過引進隨機變數的攪和,可能會變成複雜無比。初學者說不定以為天下本無事,庸人自擾之。但對統計專家,他們往往視複雜為變化多端,且能使適用範圍變得更廣泛。換句話說,將更有趣且更有用。

隨機變數可取離散值,如取值自{123456}也可取連續值,如取值自區間[0,1]。假設一隨機變數X,所取可能的值為x1x2,…,xn,機率值各為f(x1)f(x2),…,f(xn),這些機率值都介於01之間,且和f(x1)+f(x2)++f(xn)=1。則此函數f,便稱為X之機率密度函數(常就寫pdf)這是離散型,因X取離散值。要注意離散型隨機變數,也可取無限多個可能的值。如取值在正整數集合,或更一般,取值自{x1x2,…,xn,…}。有了pdf f,諸如X取值x1x2之機率,便等於f(x1)+f(x2)。次看取連續值的隨機變數X。例如,設X取值在區間[0,1],且設存在一函數g,使得X取值在區間[a,b]的機率,為g[a,b]的積分,其中0<a<b<1。則此函數g亦稱為X之機率密度函數。這是連續型,因X取連續值。同樣,連續型隨機變數也可取值自一無限集合,如實數集合。又對一隨機變數XX不超過x之機率,常以F(x)表之。F(x),其中x為實數,便稱X之分佈函數(distribution function)。給出機率密度函數,或分佈函數,一隨機變數的分佈情況便完全決定了。有些分佈(或者說有些機率密度函數)較常出現,隨機變數若有這種分佈,便稱有常見分佈。常態分佈便是一個大家熟知的常見分佈

機率密度函數可人為造出。如對離散型,一函數只要大於0,在取值處相加為1,便為一pdf;而對連續型,一函數只要大於或等於0,在取值範圍內之積分為1,便為一pdf。另外,亦可經由實際觀測產生。如令X表投擲一出現正面機率為p之銅板。則由排列組合,可得

P(X=k) = C(n,k)pk(1-p)n-k

其中k=01,…,nX便稱有參數np之二項分佈。為一常見分佈。當然還有其他產生機率密度函數的方式,如經由變數代換,或經由極限等,在此先不討論。雖可人為造出無限多個機率密度函數,但並沒太多能成為常見分佈。一個分佈,至少要有趣或有用,才有可能被重視。像是有很多好的性質,或能做為很多隨機現象之機率模型等。例如,諸如身高、體重或智商等,往往能以常態分佈來描述,再加上常態分佈有不少有趣的性質,因此這分佈便重要無比了。由將之命名為常態,就知常態分佈所具獨尊的地位

對一離散型的隨機變數X,所取可能的值為x1x2,…,xn,則x1f(x1)+x2f(x2)++xnf(xn),便稱X之期望值(expectation),常寫成E(X),且常以希臘字母μ來代表E(X)。若X取無限多個可能的值,則前述和便無止境地延,此時期望值並不一定存在,但此問題要待讀者具備夠多的微積分知識後,才能討論。又(x1-μ)2f(x1)+(x2-μ)2f(x2)++(xn-μ)2f(xn)稱為X之變異數,寫成Var(X)。變異數常以希臘字母σ2表之。再度,若X取無限多個可能的值,則前述和便無止境地延,且也不一定存在。至於連續型隨機變數,期望值及變異數,xf(x)(x-μ)2f(x)在取值範圍內之積分。變異數的正平方根,即為標準差。

我們常說建立機率模型,收集到數據,繪出直方圖,看似那一已知的機率密度函數,然後做個統計檢定,以確定是否吻合。

參考文獻

1. 黃文璋(2011). 認識機率.數學傳播季刊, 35(2): 32-44.

   暫無回應
 回本區首頁 
  回應總數0  
 
 
  下一頁  
  
 
我要回應
姓 名: 回應前,請先註冊登入
E-mail:
內 容:
驗證碼:  (I974
 
 
:::
 
*

地  址:811高雄市楠梓區高雄大學路700號
電  話:07-5919362 傳真:07-5919360 e-mail: stat@nuk.edu.tw
更新日期:2024/3/28 下午 01:15:41

2003/10/20起第 8911710 位訪客
*