國立高雄大學統計學研究所
最新消息 本所簡介 師資介紹 開設課程 教師成果 學生表現 學術演講 入學管道 學生園地 心在南方 表格下載 活動集錦 網路資源 關於我們
本站首頁 本校首頁 英文版
:::心在南方  
主題:談統計素養(七)
發表者:黃文璋 Email:huangwj@nuk.edu.tw 日期:2017/3/6 下午 08:48:25

7 檢定

數學裡常在證明,在給定的前提下,推導出某些結果成立。如何推導?如同下棋、打牌,各有規則,數學中亦自有一套演繹的邏輯。由給定的前提,一步一步完成證明。不擅長證明的人,數學通常也就學不好。棋下不好,或牌打不好,對人生可能沒什麼影響。但對中學生,若數學不佳,可能會影響到能進的大學學系。幸好就只是這樣而已,不擅長數學,對人生倒不見得有什麼大不好。

以命題來描述,給定的前提稱為A,欲推導出來的結果稱為B。若A成立,則B必成立,便稱此命題為真(或稱成立),否則稱此命題為偽(或稱不真、不成立)。數學裡,便經常在證明一個又一個的命題為真或為偽。某命題一旦被證明為真,除非能找出漏洞,推翻證明,否則便不必試圖去找反例。只是世事以真偽難辨的居多。由於無法證明,科學家遂習於以證實一詞,宣佈其發現。以咖啡為例。研究證實:愛喝咖啡助長壽,這是一則新聞的標題。事實上,不時有研究報告指出,喝咖啡的好處多多,除有助長壽外,亦有能降低罹患阿茲海默症的風險之說法。當然證實喝咖啡有害人體的報告也不少。但畢竟僅證實並非證明,因此常是信者恆信,不信者恆不信。科學上究竟是如何證實呢?

設有一公正銅板,投擲20次,試求出現19個正面的機率。這是高中數學裡,一道典型的題目。公正銅板,說起來輕鬆無比。因數學中的假設是不須證明的,所以不必質疑銅板是否真的公正;或去想世界上是否存在公正的銅板?而且眾所皆知,做這種題目,並不需去投擲。甚至,根本不必有銅板,就能求出答案了。不過,若真拿到一銅板,且投擲20次,出現10個正面,自然不會懷疑銅板的公正性;但如果出現19個正面呢?恐怕將難相信銅板為公正。只是不論怎麼投擲,都無法證明銅板公正或不公正。銅板是否公正,永遠只有天曉得。實務上,銅板公正,僅能是個假設,就看接受或不接受。如何判定?也就是怎樣才會接受銅板為公正?投擲20次,若只有正面恰好出現10個,才相信銅板公正,便未免太嚴格了。因即使銅板真的公正,此機率才約0.1762。如此一來,將有約82.38%的公正銅板,被誤判為不公正。統計裡發展出檢定一假設,是否可接受的程序,即假設檢定(testing hypothesis)。此亦顯示統計與數學的不同。之前說,數學是從給定的前提下,推導出結果。統計則是由給定的結果,來驗證前提為何。

很多人都聽過檢定,有各種檢定。如象棋與圍棋的棋力檢定等。參加檢定者,依據其測驗或比賽的成績,是否達到某一事先設定的標準,以判定能否通過某級或某段之檢定。想知道自己棋力者,會去參加檢定?而原本已擁有某級()證書者,近來有時打敗比他高一級()者,自覺棋力進步了,想要晉級(),也會去參加檢定。但由於臨場反應等因素,其中無法避免會有運氣成分。

如前所述,數學裡的命題,一旦被證出,就毫無例外地成立,由不得你接不接受,因那已是一事實。統計裡針對一有興趣的假設,若通過檢定,便接受此假設。而就像棋力檢定,檢定的通過與否,機運免不了。因此一通過檢定,被接受的假設,並不表就是事實。這說明了科學上所宣佈的證實,何以總會有人不相信。因那些所謂證實,往往是基於通過了統計假設檢定。故若有人以為通過檢定,只是運氣好,因而不肯相信,乃可理解。科學上的研究,涵蓋面很廣,各式各樣的證實很多。對諸如科學證實快樂的人有這10個共同點之類的報導,目不暇給之餘,或許會讓人產生疑惑:就算號稱通過統計檢定,是否假統計之名?

在假設檢定的架構裡,有虛無假設(null hypothesis),與對立假設(alternative hypothesis)假設。虛無假設通常表現況,或傾向想推翻的;而對立假設則表傾向接受的。與刑法上的無罪推定原則一樣,雖目的是想推翻虛無假設,但作法卻是儘量保護它,除非佐證夠強,否則不會推翻虛無假設。如此一旦推翻,接受想要的對立假設,才較具說服力。若與棋力檢定的例子對照,虛無假設即目前擁有證書上的級()數,對立假設則相當於擬晉的級()數。檢定的結論將是接受虛無假設未晉級(),或接受對立假設晉級()

之所以執行一假設檢定,乃是因懷疑虛無假設不真。由此應能明白虛無假設何以名之為虛無了。虛無(null)就是空,若經過檢定後,接受虛無假設,表整個過程白費,退回到現況。想想消費者保護會懷疑某食品有毒,大費周章地進行檢定後,宣佈食品合格;被檢察官起訴的嫌犯,最後被法官判定無罪,這些都將落入天下本無事,庸人自擾之的窘境。

在假設檢定裡,通常以H0Ha,分別表虛無假設及對立假設。舉例來看。令p表某銅板出現正面的機率。原本銅板被視為公正,若懷疑銅板較易出現正面,則取H0p=1/2Hap>1/2;若明確地懷疑p應是0.55,則取H0p=1/2Hap=0.55;若只是覺得銅板不公正,則取H0p=1/2Hap≠1/2。對隨機現象做決策,要從不誤判幾乎是不可能。會有兩種可能的誤判。其一是H0為真,卻拒絕H0,接受Ha,稱此為第一型錯誤;其二是Ha為真卻拒絕Ha,接受H0,稱此為第二型錯誤。在無罪推定之原則下,通常犯第一型錯誤比較嚴重。因食品明明合格卻被判定有毒,則商譽及銷售都將受損;根本無罪卻被判有罪,可能受罰或坐牢,甚至毀了人生,這種錯誤較難彌補。

先設定一個第一型錯誤機率值之上限α,稱為顯著水準(significance level)。通常α為一較小的值,0.050.01,及0.001等,都是常取的值。實務上,究竟怎樣的機率才算小,當然須視情況而定,不能一概而論。如果嫌犯被以死刑罪起訴,則α取成百萬分之1都不算小。在α給定後,便決定何時拒絕H0,即決定拒絕域。在H0為真的假設下,出現的結果,若落在拒絕域(機率不能超過α),便稱得到顯著的(significant)結果,或者說檢定結果為顯著。怎樣的事件才顯著?人們常說狗咬人不稀奇,人咬狗才稀奇。小機率事件才屬顯著,因這種事件若發生,將讓人不可等閒視之。結果顯著,動搖了虛無假設的基礎,便該拒絕H0。出現的結果,若沒有落在拒絕域,表所發生乃機率大的事件,也就是觀測到稀鬆平常的結果,不足為奇。既然H0的假設,沒有使不合理的現象發生,那就宜照舊,即仍接受H0。執行一檢定,暗中希望的,是得到顯著的結果。結果顯著,拒絕H0接受Ha,才表檢定沒白做,是一成功的實驗。在同一α下,拒絕域的選取,若能使第二型錯誤的機率值β最小,當然最好。此時的拒絕域,稱為顯著水準不超過α下之最佳拒絕域。在某些條件下,統計學裡有一套找到最佳拒絕域的方法。

既然犯第一型錯誤較嚴重,那α是否取得愈小愈好?一般而言,α愈小β將愈大,無法兩全。以法庭審判為例,若法官悲天憫人,寧可錯放1千,而不願錯罰1人,對證據的審核高度嚴格,則很多實際有罪者,將被宣判無罪,興高采烈地回家了;作假的不肖商家,可繼續矇騙顧客了。所以α取得過小,便太保護虛無假設,明明不真卻拒絕不了,並非好事。但也不宜為了使檢定易成功,而取太大的α,這樣現況將常被推翻。須視不同狀況,斟酌取適當大小的α

某公司欲檢定某種研發出來的飲料,喝了是否有助減肥。取H0減肥無效,Ha減肥有效,且取α=0.05。則即使該飲料完全無助於減肥,仍有20分之1的機率,會得到顯著的結果,因而接受設該飲料對減肥有助益。除了那20分之1的犯錯機率外,會不會有人持續做實驗,最後只公佈結果顯著的那件?也就是假統計之名。說不定就是因懷疑這種可能性,使有些人抗拒採信科學上的證實。不誠實的人自然存在,但夜路走多了,總會遇到鬼,作假遲早會被發現。執行假設檢定萬不可選擇性的公佈結果。

曾修習統計學的課程者,多半以為假設檢定屬較難的題材,至少比信賴區間難。之所以覺得困難,大抵是找最佳拒絕域的部分。不過在很多情況下,憑直觀所得的拒絕域,常就是最佳拒絕域。換句話說,實際應用時,即使沒去想拒絕域是否最佳,但往往得到的就是最佳拒絕域。例如,欲檢定H0p=1/2Hap>1/2,其中p表某銅板出現正面的機率。該如何進行檢定呢?要有數據,因此當然是拿起銅板投擲了。投擲n次,以X表正面出現的次數。則直觀上,會將拒絕域,取成{Xc}的形式。即若正面出現較多次,便接受Hap>1/2。至於如何選取c?乃由nα決定。此一自動浮現出來的,就是最佳拒絕域。

我們再介紹p-(p-value)。進行一檢定,當得到一觀測值後,人們常會給出p-值。所謂p-值,即在H0下,會得到比觀測值,至少同樣極端的事件之機率值。對前述檢定銅板是否公正之例,設n=100,且觀測到X=63。則p-值便為p=1/2時,事件{X≥63}之機率。投擲一公正銅板100次,所得正面數比期望值50至少大13,可求出機率約為0.0062。得到此p-值後便知,只要給定的α0.0062小,就不能拒絕H0;而若給定的α大於或等於0.0062,就得拒絕H0。給出p-值,將較能看出,是很有把握地(p-值比α小很多)拒絕H0,或勉強地(p-值僅比α略小)拒絕H0

空氣品質有沒有變好?石化工業對健康是否有影響?這類備受各界矚目的問題,其判定自然得依據嚴謹的假設檢定。至於13號星期五較不吉利嗎此君值得信賴嗎?這些我們生活上經常會面臨的抉擇,與其靠占卜、星座等,其實亦該仰賴假設檢定的思維。假設檢定是為做較佳決策,該具備的統計概念。

   暫無回應
 回本區首頁 
  回應總數0  
 
 
  下一頁  
  
 
我要回應
姓 名: 回應前,請先註冊登入
E-mail:
內 容:
驗證碼:  (SN33
 
 
:::
 
*

地  址:811高雄市楠梓區高雄大學路700號
電  話:07-5919362 傳真:07-5919360 e-mail: stat@nuk.edu.tw
更新日期:2024/4/11 上午 09:16:10

2003/10/20起第 9058362 位訪客
*