國立高雄大學統計學研究所
最新消息 本所簡介 師資介紹 開設課程 教師成果 學生表現 學術演講 入學管道 學生園地 心在南方 表格下載 活動集錦 網路資源 關於我們
本站首頁 本校首頁 英文版
:::心在南方  
主題:談統計素養(十)
發表者:黃文璋 Email:huangwj@nuk.edu.tw 日期:2017/4/3 下午 07:44:32

10 隨機性

我們常提到隨機,如隨機現象及隨機變數等。其中的隨機一詞,定義是很寬鬆的。簡言之,只要不是一成不變即可。假設一銅板有正及反兩個面,往上一拋,觀測落地後朝上的為正面或反面,此便是一隨機現象,因事先不確定那一面會朝上。若銅板兩個面皆為正,則投擲後,朝上的必然是正面,沒有其他可能,所以這並非隨機現象。但亦有人稱此為一退化的隨機現象。即只要視一成不變為退化,則所有的現象,便無不為隨機現象。在隨機現象裡,用來投擲的銅板或骰子等,都不一定要公正,但仍要符合該有之規定,如各面出現的機率和為1

不過對於統計檢定或民調裡,所提到之隨機取樣,其中的隨機,往往有特別的涵義。底下為幾種常見的情況。第一種是隨機樣本。例如,為檢定某廠牌電池的壽命,首先便是隨機取n個來測試,因而得到X1Xn,其中Xi表第i個受測電池的壽命,i=1n。一般會假設電池品質一致,且各電池的測試互不干擾,亦即設X1Xn,有相同的分佈,且相互獨立。則X1Xn,便稱為一組隨機樣本。第二種情況是簡單隨機抽樣(simple random sampling),乃針對有限的母體。欲取一組樣本數為n(n當然要小於母體數)之樣本,若母體中任一組可能的樣本,皆有相同的機率被抽到,便稱此抽樣步驟為簡單隨機抽樣,而獲得的樣本,則稱為簡單隨機樣本(simple random sample)。須注意的是,是要求每一組樣本數為n之樣本,皆有相同的機率被抽到,而不僅是每一個樣本,皆有相同的機率被抽中,前者的條件較強。即若母體數為mm>n,則總共的C(m,n)組可能之樣本,每一組被取中的機率,皆須為1/C(m,n),如此所得才是隨機樣本。如果自母體中,每次依序隨機取一樣本,取出後皆不放回,即第1次,母體中每一樣本被取中的機率為1/m,第2次每一樣本被取中的機率為1/(m-1),以此類推,則n次後,所得便是一組樣本數為n之簡單隨機樣本。這是一較易執行之實際取樣方式。

如何檢定一銅板是否公正?當然就是先隨機投擲。此處的隨機,就是指將獲得一組隨機樣本。更明確地說,投擲同一銅板(其涵義為各次得到之結果,有相同的分佈)n次,各次投擲假設互不干擾(其涵義為相互獨立)。有趣的是,在隨機投擲下,其中又會含有不少隨機性。例如,假設隨機投擲一銅板(並不須是公正)4次,得到2個正面。此2正面會出現在那裡?C(4,2)=6,從4次中取2次來放正面,6種可能的位置,出現之機率會相同,即皆為1/6一般若一銅板隨機投擲n次後,得到k個正面,此k個正面如何散佈?將有如母體數為n,從中採簡單隨機抽樣,以得一組k個樣本。即總共的C(n,k)組可能之樣本,每一組被取中的機率,皆為1/C(n,k)

A君想讓B君相信他手上的銅板為公正。隨機投擲20次,假設出現10個正面,顯然可通過銅板是公正之檢定。只是B君注意到,前10次投擲出現7個正面,後10次投擲卻僅出現3個正面。這麼偏頗?銅板真的公正嗎?B君懷疑。A君不計較,重新投擲銅板20次,這回剛好出現11反,11反。仍出現10個正面,且前後10次各5個,這樣總沒話講了吧!A君心想。不料細心的B君再度指出,10個正面,皆出現在奇數次投擲,偶數次投擲,則1個正面也無。B君的一再質疑,反使A君想通了。他對B君說,10個正面,就是會出現在某10次投擲,你豈非永遠可質疑,為何僅這10次出現正面?B君總算不說了。

事實上,10個正面集中在前10次,或奇數次投擲,這些是較明顯的,很難不被注意到。有如496的樂透彩,若頭獎號碼開出123456,可能會很轟動,傳誦多年。但其實這組號碼,與任何一組,如看起來很普通的91423293546,及41021233846都一樣,出現的機率,皆為1/C(49,6)=1/13,983,816,只是123456這組,較引人注目而已。

投擲銅板20次,在出現10個正面下,10個正面皆出現在奇數次(或前10)投擲,其機率為1/C(20,10)=1/184,756,的確相當小。所以若出現此狀況,有人感到懷疑,並非完全不合理。大膽懷疑無妨,惟須小心求證。要知投擲銅板,若出現的正面數過於偏頗,會讓人認為銅板非公正;但若出現過於巧合的結果,也是會讓人懷疑有作假。現考慮投擲次數較一般的情況。假設投擲一銅板2n次,且出現n個正面。這本來還好,但仔細一看,n個正面,都發生在奇數次投擲,其機率為1/C(2n,n)。當n=123,此機率分別為1/21/61/20,愈來愈小,且隨著當n之增大,將漸減至0。換句話說,n不大時還好,n愈大恐會愈起疑。11反交錯,看起來很公平,卻不但不會讓人相信銅板確實公正,反而會懷疑是否真做到隨機投擲?底下來看一些例子。仍先看公正銅板。

隨機投擲一公正銅板20次,給定出現10個正面。令

Mi=P(前、後10次投擲中,各出現i(10-i)個正面)i=0110

Mi=C(10,i)C(10,10-i)/C(20,10)=C(10,i)2/C(20,10)i=0110

由於Mi=M10-i,因此只需給出M5M10,即可。之前已給

C(20,10)=184,756

再求出

C(10,5)=252C(10,6)=210C(10,7)=120

C(10,8)=45C(10,9)=10C(10,10)=1

即得

M5=2522/184,756=63,504/184,756≈0.344

M6=2102/184,756=44,100/184,756≈0.239

M7=1202/184,756=14,400/184,756≈0.078

M8=452/184,756=2,025/184,756≈0.0110

M9=102/184,756=100/184,756≈0.000542

M10=1/184,756≈0.00000542

由上述Mi,可看出前、後10次投擲中,各出現5個正面,看起來是很均衡,但發生機率約為0.344,只比1/3稍大些。出現不均衡的可能性反而大多了,約0.656,接近2/3。而前、後10次投擲中,有1出現6個正面,有1出現4個正面,發生機率約為2M6≈0.478。原來有點偏差,才是最可能的。但並不致於過度偏差。如10個正面,都集中在前、後的某10次投擲中,這麼極端的情況,其發生機率僅約2M10≈0.0000108,根本很少會出現。

我們再令

Ni=P(前、後10次投擲中,有一出現至少i個正面)i=0110

N0=N1=…=N5=1,這是當然的。又

Ni=2×(Mi2+…+M102)/C(20,10)i=610

N6=121,252/184,756≈0.656

N7=33,052/184,756≈0.179

N8=4,252/184,756≈0.0230

N9=202/184,576≈0.00109

N10=2/184,576≈0.00001

投擲銅板20次,總共出現10個正面,銅板的公正性,看起來並沒問題。但在給定出現10個正面下,若前、後10次投擲中,有一出現過多(8910)的正面,是可懷疑投擲過程,並非如所宣稱的隨機。至於若要釐清,就去執行一假設檢定,以進一步確認。

在上例中,N7不算小,有0.179N8雖較小,卻也仍有0.0230。顯示投擲一公正銅板20次,在給定出現10個正面下,前、後10次投擲中,出現的正面數為733782,或28,偏離期望值5雖遠些,但發生的可能性都尚不算很小,主要是投擲數20不是很大。假設投擲次數40,且依然出現半數20個正面。則可求出對應的

N15=2×(C(20,15)2+C(20,16)2+C(20,17)2+C(20,18)2+C(20,19)2+C(20,20)2)/C(40,20)≈0.00192

此時前、後20次投擲中,有一出現至少15(75%)個正面之機率,便大幅下降。

最後,來看一非公正銅板之例。假設投擲一出現正面機率為0.88125之銅板56次,得到50個正面。由於期望所得之正面數為49.35,所以對所宣稱出現正面機率為0.88125,並沒什麼好挑剔的。令MiNi的定義如上,但此處將56次投擲,分成前28次,及後28次兩部分。則

M25=C(28,25)2/C(56,50)=10,732,176/32,468,436≈0.331

M26=C(28,26)C(28,24)/C(56,50)=7,739,550/32,468,436≈0.238

M27=C(28,27)C(28,23)/C(56,50)=2,751,840/32,468,436≈0.0848

M28=C(28,28)C(28,22)/C(56,50)=376,740/32,468,436≈0.0116

由此得N25=1,且

N26=21,736,260/32,468,436/32,468,436≈0.669

N27=6,257,160/32,468,436≈0.193

N28=753,480/32,468,436≈0.0232

跟之前投擲銅板20次出現10個正面之例比較,如今前、後28次投擲中,各出現25個正面,此最均衡的狀況,發生之機率M25最大,約為0.331;至於愈偏差的機率則愈小。又前、後28次投擲中,除非有一全出現正面(即有28),此機率約為0.0232,否則都不算太偏頗。

   暫無回應
 回本區首頁 
  回應總數0  
 
 
  下一頁  
  
 
我要回應
姓 名: 回應前,請先註冊登入
E-mail:
內 容:
驗證碼:  (C49V
 
 
:::
 
*

地  址:811高雄市楠梓區高雄大學路700號
電  話:07-5919362 傳真:07-5919360 e-mail: stat@nuk.edu.tw
更新日期:2024/4/11 上午 09:16:10

2003/10/20起第 9003303 位訪客
*