國立高雄大學統計學研究所
最新消息 本所簡介 師資介紹 開設課程 教師成果 學生表現 學術演講 入學管道 學生園地 心在南方 表格下載 活動集錦 網路資源 關於我們
本站首頁 本校首頁 英文版
:::心在南方  
主題:38 假設檢定
發表者:黃文璋 Email:huangwj@nuk.edu.tw 日期:2014/12/14 下午 09:39:54

在“論語”“先進篇”:

子路、曾皙、冉有、公西華侍坐。子曰“以吾一日長乎爾,毋吾以也。居則曰‘不吾知也’,如或知爾,則何以哉?…”

孔子(西元551-479)問幾個學生,如果有人知道你們,要任用你們,你們將如何做?這完全是假設性的問題,學生也個個依序回答,沒一人避答。

人們自小起,便常在談假設性的事,也不怕回答假設性的問題。如從小學起,不時要以“我的志向”為題作文,那不就是在回答“假設長大後,要做什麼?”的問題。學生總不能說,我不一定能活那麼久,這種假設性的問題無法作答。而申請研究所時,所寫的讀書計畫,不也是在回答“假如進了研究所,將如何?”的問題。雖不見得會被錄取,但還是要告訴對方,被錄取後準備怎麼做。只是不知從何時開始,政治人物慣說“假設性的問題不回答”。猜想可能是擔心,明明以假設(或如果)開頭的問題,而且是發問者自己的假設,一旦回答後,便被當做被問者的假設,進而成為被問者心中所想。例如,一旦回答記者“假設你是總統…”的問題後,刊登出來,可能變成xxx想選總統了。有趣的是,當政治人物說出“假設性的問題不回答”後,記者通常便不追問了。

但生活中,就是充滿著假設。自中學起,在數學課裡,便常面臨命題。證明某命題為真,或證明某命題為偽。即在某些假設下,推導出某結果成立,或不一定成立。命題中的假設,並不必證明。例如,“假設有一直角三角形,則兩股平方和等於斜邊平方”,這即著名的畢氏定理。要證明此命題,不必懷疑三角形是否真有一直角。在數學裡,對於所給的假設,接受便是。而且,即使量測一萬個直角三角形,毫無例外,個個的確都滿足兩股平方和等於斜邊平方,離完成證明,仍相差十萬八千里。數學中並不以多取勝,甚至也不需眼見為實。因此連一個直角三角形都不必去量測三邊,所須做的,是依數學程序,導出對任意的一個直角三角形,兩股平方和等於斜邊平方。另外,除非證明過程中有錯誤,否則一旦證出來,便不可能找到反例。反之,若找到反例,便表原始命題有誤。即使宣稱證出來了,其中也必有錯。

數學裡的假設,雖相當自由,無須被檢驗,但也不能胡亂假設。因如果假設不真,則可能得到很荒謬的結論。例如,“若3=4,則三角形有五個邊”此命題乃為真。三角形怎會有五個邊?3都可以等於4了,還有什麼不行?真要證明,可利用邏輯裡“若pq”,與“若非q則非p”等價。上例亦說明,對那些指鹿為馬者,人們何以會特別有顧忌,因知道在那些人心中,沒有什麼不可以。

數學裡有時也會給定假設,然後去解一些問題,所謂應用。例如,假設汽油一公升可行駛18公里,問20公升可行駛幾公里?你知道當然是360公里。只要是純數學的問題,便不會被挑戰。但若這是一真實的情況,即某廠牌汽車商,宣稱他們賣的車,汽油一公升可跑18公里,則說不定便有買了該廠牌車的消費者,因注意到每公升根本跑不到18公里,而懷疑廠商有誇大之嫌。因此當進入實際生活,一公升汽油可行駛幾公里,便不可胡亂假設,一定要有所本。

在石堅,李竹渝譯(1998)的“統計與真理”一書中,原作者當代著名統計學者勞氏(C. Radhakrishna Rao1920-),在序文中寫著:

學生時代,我主修數學─一種從給定前提下演譯結果的邏輯。後來我唸統計學─一種從經驗中學習的合理過程,及從給定的結果驗證前提的邏輯。我已認識到數學及統計,在人類為提昇自然知識,及有效管理日常事務,所做的一切努力中,佔有重要性。

我相信:

在最終的分析中,所有知識皆為歷史。

在抽象的意義下,所有科學皆為數學。

在理性的世界裡,所有判斷皆為統計。

這段話,正足以說明數學與統計之別。數學裡18就是18,永不會改變。只是我們所處,乃一隨機世界。一公升汽油究竟可行駛幾公里,不要說對同一輛車,便非永為定值。就算是新車,亦不見得每部都相同。一公升汽油能行駛的里程數,是會變動的。就是這樣,在隨機世界中,那些是真,那些是偽,常難以判定。你要真相?真相只有天曉得。幾乎可以說,一切都是假設。差別只是,看到結果後,有些原先的假設能接受,有些則難以接受。如何假設,及在怎樣的情況下,假設可被接受,或被拒絕(又稱棄卻),便是統計學裡假設檢定(hypothesis testing)的問題。

在蕭敬騰(1987-)那首“奮不顧身”中,有句歌詞“我愛你,往往來不及證明”。眾所周知,不像在數學中,世上很多事並無法證明。例如,主持婚禮的牧師,並非問新娘“你確定這個男人是你的真命天子嗎?”這樣問太不實際,取而代之,是問“你願意接受這個男人為你的丈夫嗎?”至於願不願意,不就是看標準訂多高?標準若設太高,便接受不易。一旦標準降低,就容易接受了。人生乃充滿妥協,很多時候,雖不滿意,卻也只能接受。數學中處處是證明,科學裡則講“證實”。例如,不時會看到標題如下的新聞報導“德國科學家證實,喝綠茶可以減肥。”科學家並未宣佈他們證明出喝綠茶可以減肥,這大概無論如何都難以證明,而是說證實可以減肥。但證實畢竟不是證明,科學家若經一套自認合理的取樣過程,及一合理的判定過程,宣佈“證實直角三角形兩股平方和等於斜邊平方”,數學家即使不嗤之以鼻,也不會有太大興趣。他們要的是證明,而非什麼證實。有些證實後來發現的確為真,但有些後來有人提出結論迥異的證實,而有些則一直令人半信半疑。底下我們來看,科學家到底如何證實。

大家都聽過兩人分蛋糕的問題。該如何分,才會讓雙方都覺得公平?由一人負責切,然後讓另一人優先挑選,便是一簡單又合理的方法。很多時候,就是會遇到這類如何讓雙方都能服氣的情況。歐陽修(1007-1072),在追念其父母的“瀧岡阡表”一文中,提到其父為死囚“求其生而不得,則死者與我皆無恨也”。真是洞燭機先,早在1千多年前,歐陽修之父,可說便已具備現代法律裡所重視之“無罪推定”的精神。我國刑事訴訟法第154條:

被告未經審判證明有罪確定前,推定其為無罪。犯罪事實應依證據認定之,無證據不得認定犯罪事實。

這就是所謂“無罪推定原則”。我國最高法院,於民國25年立,下有罪推定原則的判例後,經過65年,於民國90年,終於廢止該判例。自此被告原則上是無罪的,法官只要認定罪證不足,即可宣判無罪,而不必窮調查之途。在無罪的前題下,若證據夠充分,就不得不判定有罪。必須一提的是,前述條文裡的“證明”一詞,與數學裡的證明意義並不同,而與“證實”較同義。

依無罪推定原則,如果德國科學家相信喝綠茶可以減肥,那該如何假設?要先假設喝綠茶不能減肥,然後若證據夠強,便能推翻此假設,即證實喝綠茶可以減肥。假設檢定的理論與架構,是波蘭裔的統計學家奈曼(Jerzy Neyman1894-1981),及英國統計學家艾根皮爾生(Egon S. Pearson1895-1980,為Karl Pearson之子),於1933年,給出著名的奈曼-皮爾生引理(Neyman-Pearson lemma)所奠定的。他們設計了一套流程。一開始先確定二假設,即虛無假設(null hypothesis)與對立假設(alternative hypothesis)。虛無假設通常表現況,或傾向想推翻的;而對立假設則表傾向接受的。雖想推翻虛無假設,不相信虛無假設,卻儘量保護,不讓它輕易被推翻。如此一旦推翻,才能減少不服。也就是須依循“求其生而不得,則死者與我皆無恨也”的想法。

對隨機現象做決策,要永不誤判幾乎是不可能。例如,若懷疑某銅板較易出現正面,令p表銅板出現正面的機率,則可將虛無假設取為p=1/2,對立假設取為p>1/2。只是即使銅板實際出現正面的機率為0.55,比1/2大了不少,投擲100次,也可能無可挑剔的正反面各得50次。這時合理的推論,當然是接受虛無假設,但這就誤判了。至此,讀者也許可以明白,虛無假設何以名之為“虛無”了。天下本無事,庸人自擾之。不信銅板公正,要進行檢定,大費周章後,卻仍接受銅板為公正,整個過程可說白忙一場,灰頭土臉。英文null的意義為空的。接受虛無假設,表接受一空的假設。試想,法官若判定被檢察官起訴的嫌犯無罪,消費者保護會,若宣佈經檢驗某食品成份合格,表示整個過程沒有建設性,完全多此一舉。檢察官得重新偵辦案子了,而自以為為民眾把關的消費者保護會,說不定會被認為擾民。

為了簡便,我們以H0Ha,分別表虛無假設及對立假設。會有兩種可能的誤判。其一是虛無假設為真卻拒絕,稱此為第一型錯誤;其二是對立假設為真卻拒絕,稱此為第二型錯誤。在無罪推定之原則下,被起訴者明明無罪卻被判有罪,便犯了第一型錯誤;實際有罪卻被判無罪,便犯了第二型錯誤。通常犯第一型錯誤比較嚴重。因無罪被判有罪,可能坐牢,或受處罰;食品明明合格卻被宣佈有毒,則商譽及銷售都將受損,這種錯誤較難彌補。至於有罪被判無罪,犯罪者僥倖逃過制裁,若因此改邪歸正,那便還好;但若得意忘形,則夜路走多,疏漏愈來愈大,總有被定罪的一日。

先設定一個第一型錯誤機率值之上限α,稱為顯著水準(significance level)。通常α為一較小的值,0.050.01,及0.001等,都是常可能取的值,表示認定這樣的機率夠小了。實務上,究竟怎樣的機率才算小,當然視情況而定,不能一概而論。如果若是死刑罪,則α為百萬分之1都不算小。在α給定後,決定何時拒絕H0,即決定拒絕域。在H0為真的假設下,出現的結果,若落在拒絕域,便稱得到顯著的結果,因小機率事件發生了,不可等閒視之。結果顯著,便該拒絕H0。出現的結果,若沒有落在拒絕域,表得到發生機率不算太小的結果,乃屬尋常,不夠顯著,尚不足以撼動H0的假設,遂仍接受H0。在同一α下,拒絕域的選取,若能使第二型錯誤的機率值β最小,當然最好。此時的拒絕域,稱為顯著水準不超過α下之最佳拒絕域。在某些條件下,統計學裡有一套找到最佳拒絕域的方法。

既然犯第一型錯誤較嚴重,那α是否取得愈小愈好?一般而言,α愈小β將愈大,無法兩全。以法庭審判為例,若法官悲天憫人,寧可錯放1千,而不願錯罰1人,對證據的審核高度嚴格,則很多實際有罪者,將可興高采烈地等著被判無罪了。很多作假的商家,又可繼續矇騙顧客了。所以α取得過小,不見得就好。宜視不同狀況,斟酌取適當大小的α

現考慮檢定銅板出現正面的機率p。設H0p=1/2Hap1/2。即擬檢定此是否為一公正銅板。持續投擲銅板n次,以X表所得正面數,則XB(n,p)分佈。當H0為真,即p=1/2,則觀測到的X,較可能落在期望值n/2的附近。所以直觀上,當X偏離n/2較大時,該拒絕H0。由是取拒絕域為{|X-n/2|c}={Xn/2+c,或X£n/2-c},其中cnα決定。現取n=100α=0.05。再度,因n較大時,二項分佈的機率值就不太好算了,以常態分佈來近似,得c約為9.8,取整數c=10。如此拒絕域={X60,或X£40},如此實際的α值約為0.0456。對離散型分佈,有時無法取到剛好能達到所給α值之拒絕域。另外,若α=0.01,則c約為12.88,所以取c=13。如此拒絕域={X63,或X£37},如此實際的α值約為0.0094。在同樣的n之下,α值愈小,表H0愈被保護,因此拒絕域將愈小,即愈不容易拒絕H0。當α=0.01,如果投擲銅板100次,得到62個正面,比在H0(銅板為公正)的期望值50多了12,即超過24%,感覺上很偏差,卻仍得接受此銅板為公正。沒辦法,那是因α太小的關係。解決之道是加大n。假設取n=10,000,則在H0下,X之期望值=5,000。當α=0.01時,c約為128.8,故取c=129,且拒絕域={X5,129,或X£4,871}。此時正面數X,只要比5,000偏離逾129/5,000=2.58%,就得拒絕H0了。至於有關求第二型錯誤的機率,比較複雜些,在此不討論。

統計是門入世的學問。統計學裡提供一套假設檢定的程序,以為做決策,或給推論時之依據。此程序並非用來判定事情的真偽,而是用來做為決定對策之指引。此處僅對假設檢定給一粗淺的介紹,想進一步認識此題材者,可參考黃文璋(2004)(2005)二文。又本文有部分材料,取自黃文璋(2014)一文。

參考文獻

1. 石堅, 李竹渝譯(1998). 統計與真理─怎樣運用偶然性(Statistics and Truth: Putting Chance to Work, 2nd ed., C. Radhakrishna Rao原著). 九章出版社, 台北市.

2. 黃文璋(2004). 統計學裡無罪推定的精神. 科學發展月刊, 383(200411月號): 68-73.

3. 黃文璋(2005). 統計顯著性. 數學傳播季刊, 29(4): 29-38.

4. 黃文璋(2014). 假設與檢定. 黃家小館(http://huang.nuk.edu.tw/cindex.htm).

   暫無回應
 回本區首頁 
  回應總數0  
 
 
  下一頁  
  
 
我要回應
姓 名: 回應前,請先註冊登入
E-mail:
內 容:
驗證碼:  (G51X
 
 
:::
 
*

地  址:811高雄市楠梓區高雄大學路700號
電  話:07-5919362 傳真:07-5919360 e-mail: stat@nuk.edu.tw
更新日期:2024/4/11 上午 09:16:10

2003/10/20起第 9003038 位訪客
*