多談無益,底下我們便來實作假設檢定。機率與統計裡,不少主題的討論,常由銅板開始。所以首先會想到的,應是檢定銅板出現正面的機率。雖說處理的僅是銅板,但大家知道,其原理可應用至很多能重複觀測的情況,只要能將出現的結果分成兩類。對於銅板,若欲檢定其出現正面的機率p,該如何進行呢?當然是先投擲再說。如同以往,各次投擲間假設相互獨立,則投擲n次後,所得之正面數X,便有二項分佈B(n,p)。
先將虛無假設及對立假設,取為
H0:p=0.5,Ha:p=0.6,
即H0與Ha皆為簡單假設。這可能源自於由觀測,懷疑銅板並非公正,且出現正面的頻率較高,似為0.6。為了簡便,考先慮較小的n,且就取n=10,如此X有B(10,p)分佈。直觀上,若出現的正面數較多,會拒絕H0。所以拒絕域取為{X≥k}的型式,其中k可能為0,1,…,11。怎會有11?此表不會拒絕H0,即一定接受H0。至於k的選取,則依事先給定的顯著水準(即第一型錯誤機率之上限)α而定。對p=0.5,0.6,及0.7,我們分別給出B(10,p)分佈之累積機率P(X£k),k=0,1,…,10,於表2。
表2 B(10,p)分佈之累積機率P(X£k)
p\k |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
0.5 |
.001 |
.011 |
.055 |
.172 |
.377 |
.623 |
.828 |
.945 |
.989 |
.999 |
1 |
0.6 |
.000 |
.002 |
.012 |
.055 |
.166 |
.367 |
.618 |
.833 |
.954 |
.994 |
1 |
0.7 |
.000 |
.000 |
.002 |
.011 |
.047 |
.150 |
.350 |
.617 |
.851 |
.972 |
1 |
在分別給定α=0.1,0.05,及0.01之下,我們來決定檢定。所謂決定檢定,即給出拒絕域。
(1)首先取α為0.01。由表2,若取拒絕域={X≥10}={X=10},則第一型錯誤之機率為
P(X≥10|p=0.5)=1-P(X£9|p=0.5)»1-0.999=0.001,
此值遠比事先選定的α=0.01小很多(指位階,一為10的-3次方,一為10的-2次方)。是拒絕域取的太小嗎?只是若取的稍大些,即改取拒絕域={X≥9}={X=9,10},則第一型錯誤之機率成為
P(X≥9|p=0.5)=1-P(X£8|p=0.5)»1-0.989=0.011,
超過所給的α=0.01。所以,就取拒絕域={X≥10}。拒絕域確定後,來求第二型錯誤之機率。由表2,得
β=P(X£9|p=0.6)»0.994,
這機率可說相當大。也就是當實際上p=0.6,卻會很容易拒絕Ha,而仍接受H0:p=0.5。雖第一型錯誤之機率,被壓到才0.001,但第二型錯誤之機率,卻很接近1,何以會如此?這樣合理嗎?原因是p=0.5與0.6差異並不太大,導致當p=0.6時,X的值會落在接受域{X£9}的機率(0.994),與p=0.5時,X的值會落在接受域的機率(0.999),都很大且相差有限。換句話說,不論p=0.5或0.6,都不容易拒絕H0。於是當p=0.6時,犯錯(接受H0:p=0.5)也就很難避免(機率0.994)了。
(2)其次取α為0.05。由表2,該取拒絕域={X≥9}={X=9,10}。則第一型錯誤之機率為
P(X≥9|p=0.5)=1-P(X£8|p=0.5)»1-0.989=0.011,
比0.05小很多。但再度拒絕域不能再大了,因若改取稍大的拒絕域={X≥8}={X=8,9,10},則第一型錯誤之機率成為
P(X≥8|p=0.5)=1-P(X£7|p=0.5)»1-0.945=0.055,
超過所給的限制α=0.05。所以,就取拒絕域={X≥9},比α=0.01時大。我們知道,α愈小,表H0愈被保護,因此拒絕域將愈小,即愈不容易拒絕H0。又此時第二型錯誤之機率為何?由表2,得
β=P(X£8|p=0.6)»0.954。
(3)再看α=0.1。由表2,該取拒絕域={X≥8} ={X=8,9,10}。則第一型錯誤之機率為
P(X≥8|p=0.5)=1-P(X£7|p=0.5)»1-0.945=0.055。
至於第二型錯誤之機率,由表2,得
β=P(X£7|p=0.6)»0.833。
上述3種情況,之所以第二型錯誤的機率β都相當大,關鍵皆在於對立假設中的p=0.6,與虛無假設中的p=0.5,二值不算差太大。現改變Ha:p=0.7。在α分別為0.01,0.05,及0.1之下,讀者不妨自行檢定
H0:p=0.5,Ha:p=0.7,
以為比較。此時β分別約為0.972,0.851,0.617,是變小一些。
附帶一提,由表2,亦可求出α在不同的範圍裡,各自的拒絕域。當0<α<0.001,拒絕域為空集合,即都接受H0;在0.001£α<0.011,拒絕域={X≥10};在0.011£α<0.055,拒絕域={X≥9};在0.055£α<0.172,拒絕域={X≥8};在0.172£α<0.377,拒絕域={X≥7};餘此類推。另外,如果觀測到X=9,則先由表2,求出p-值»0.011,然後再視給定的α值,而做決策。例如,若α=0.01,則接受H0;若α=0.05,則拒絕H0;若α=0.1,則亦拒絕H0。
由對稱性,若虛無假設及對立假設,分別取為H0:p=0.5,Ha:p=0.4,則當正面數較少,會拒絕H0。故可取拒絕域為{X£k}的型式,這也符合直觀。對給定不同的α值,拒絕域及β值,皆可對應求出,在此略去。但讀者能否看出,本檢定與前述檢定H0:p=0.5,Ha:p=0.6,二者拒絕域及β值,其間之關係?