國立高雄大學統計學研究所
最新消息 本所簡介 師資介紹 開設課程 教師成果 學生表現 學術演講 入學管道 學生園地 心在南方 表格下載 活動集錦 網路資源 關於我們
本站首頁 本校首頁 英文版
:::心在南方  
主題:42 信賴區間值得信賴嗎?
發表者:黃文璋 Email:huangwj@nuk.edu.tw 日期:2015/1/2 下午 08:54:05

民國1031223日,中國時報有一則標題是企業調薪龜速還自喜 學者批:丟臉的新聞,其中有底下一段:

國發會委員會議昨通過2015年國家發展計畫初稿,國發會主委管中閔表示,考慮國際不確定情勢,對GDP年增率首度採區間方式呈現,目標設定明年經濟成長率在3.1%至3.7%。消費者物質指數上漲率不超過2%;失業率目標區間為[3.8%3.9];就業增加率目標區間則為[0.7%1.0]。在人均所得(每人GDP)部分,國發會目標區間訂在[22,64922,807]美元,約合[707,328712,262]台幣,較今年的預測值22,518美元,增加[4,0919,025]台幣。對於首度以區間設定,取代單一目標值,被外界質疑,是怕達不到目標挨罵。管中閔表示,學過統計學的人就知道,單一設定的正確率是零,區間設定考量了各種悲觀及樂觀因素,比單一設定更務實。

以區間估計來取代點估計,該算是較科學,居然被罵?信賴區間難道不被信賴?

在蘇子堯譯(2013)一書的頁228,提到經濟預測人員提出預測時,很少會提供預測區間,理由也許是因為這樣做會危害民眾對他們專業的信任。我們知道,一般執行民調者,公佈其調查結果時,除估計值外,亦會給出正負誤差,於是也就得到估計的信賴區間。但不知為什麼在經濟方面的預測,卻總是有人只要一個明確的值。若給一區間,便覺做預測者缺乏信心。且以為如果連自己都沒信心,做出來的預測,豈會可靠?豈值得信賴?醫生這一行,處境常也類似。有人就是希望醫生給一個斬釘截鐵的答案,不能模稜兩可,否則便認為醫術不高明。看起來,是有一些人,並不以為信賴區間值得信賴。雖如管中閔(1956-)所說,只給一預測值,會正確的機率(通常)0

人們經常在估計,很多時候,會遇到難以用一個值來估計的情況。例如,欲估計投擲一公正骰子所得點數。雖期望值是3.5,但只投擲1次,無論如何都不可能得到3.5,因此怎好以3.5來估計?各面出現的機率都是1/6,若只能給一個值,則究竟要很給那一個?可能便不知如何是好。於是極不願只給一個估計值,寧可列出所有可能的結果,即123456,並附上各自的機率1/6。雖不怎麼討喜,但這的確是一個毫無瑕疵的精準估計。至於若估計投擲二公正骰子的點數和呢?雖7出現的機率,比其他點數都高,卻也只有1/6,所以可能還是寧可列出212,各點數出現的機率。投擲次數愈多,點數和愈分散,即使最容易出現的點數,其發生機率,也將愈來愈小。以投擲3次為例,最可能出現的點數和為11,發生機率僅1/8。所以,不論以那一值來估計,錯的機率都至少高達7/8。既然總和不好估計,那平均呢?由大數法則,投擲愈多次,點數平均(即樣本平均),有愈接近期望值3.5之趨勢。以3.5做為投擲n次後,所得點數平均的估計值,似乎是合理的。那可否給一點數平均的信賴區間?

通常信賴區間是針對參數的估計,較少針對樣本。但由於只要未知,便能討論機率,便能估計,比照一般求信賴區間的原理,還是能如下給出點數平均的信賴區間。

若以Sn表投擲一公正骰子n次後,所得之點數和,則Sn/n,便是點數平均。由於一旦n較大,Sn的分佈便較繁瑣,因此再度,會想到利用中央極限定理來近似。Sn的期望值為3.5n,變異數為35n/12。故只要n夠大,標準化後的Sn,即(Sn-3.5n)/[35n/12]1/2可以常態分佈來近似。因此n夠大時,約有0.95的機率,(Sn-3.5n)/[35n/12]1/2,介於-1.961.96間。由此即得

3.5-1.96[35/(12n)]1/2 £ Sn/n £ 3.5+1.96[35/(12n)]1/2

之機率約0.95。故[3.5-1.96[35/(12n)]1/23.5+1.96[35/(12n)]1/2]即為投擲一公正骰子n次後,所得點數平均之一近似的95%信賴區間。當n=100,此區間約為[3.16533.8347];當n=10,000,此區間約為[3.46653.5335]。當然Sn/n95%信賴區間並不唯一。我們所給的(近似)區間,是以期望值3.5為中心,算是最短的。

上述欲估計的Sn/n,乃為一隨機變數,它落在常數區間[3.5-1.96[35/(12n)]1/23.5+1.96[35/(12n)]1/2]的機率,為一定值。此值為何?當n夠大,毫無疑義,便近似0.95。至於一般依樣本X1X2,…,Xn,對某欲估計的參數p,所得之信賴區間,則是p並不隨機,為一定值(但可能未知),而信賴區間為一與X1X2,…,Xn有關之隨機區間。在取樣前,p落在此隨機信賴區間之機率為0.95。對同一信賴區間公式,假設實際來操作。譬如說,要班上每一位學生,都投擲銅板n次,以估計銅板出現正面的機率p。由於每人觀測到的X1X2,…,Xn不盡相同,因此每人所得之的信賴區間,通常也就不同。有些區間還可能不相交,因此自然無法每一信賴區間,都會有0.95的機率涵蓋p。只能說若得到很多不同的信賴區間,則其中約有95%個,會包含p。甚至,如果教師先給定一p值,然後要某位學生以亂數表,經由模擬以得一信賴區間,則說這已知的p,有0.95的機率,落在一根本是固定的區間自然不恰當。因對每一固定的區間,及一已知的定值p,區間或包含p(包含的機率為1),或不包含p(包含的機率為0),不會以0.95的機率包含p。由於有這些微妙的原因,所以高瞻遠矚的奈曼,當初提出信賴區間的概念時,才一併引進信心水準一詞,而避開機率一詞。

最後要講的是,經由觀測到X1X2,…,Xn,隨之得到一固定的信賴區間後,若有人問你認為該區間涵蓋p的機率為何?只要你不知p的真實值,則答0.95並無妨,這正是主觀機率!此正如同假設有人投擲一公正銅板,落地後遮住,不讓你看到,然後問你正面朝上的機率為何?雖那一面朝上其實已確定,但因你不知,很自然會說機率為1/2。這不會有問題,完全合理。至於前述0.95的答案究竟對不對?我們說過,機率並非只看少數幾次的結果。當只有一個區間,p不是在裡面,就不在裡面。但長期下來,的確有大約95%個區間,會包含p。所以,0.95的答案自然可被接受。還有要記住,之所以會信賴,之所以說信心,所指乃是得到區間的過程。若一實際所得之信賴區間,不包含欲估計之參數,不該就以為信賴區間不值得信賴。

參考文獻

1. 蘇子堯譯(2013). 精準預測: 如何在巨量雜訊中, 看出重要的訊號(The Signal and the Noise: Why So Many Predictions Fail-but Some Dont, Nate Silver原著). 三采文化出版事業有限公司, 台北市.

   暫無回應
 回本區首頁 
  回應總數0  
 
 
  下一頁  
  
 
我要回應
姓 名: 回應前,請先註冊登入
E-mail:
內 容:
驗證碼:  (0BPE
 
 
:::
 
*

地  址:811高雄市楠梓區高雄大學路700號
電  話:07-5919362 傳真:07-5919360 e-mail: stat@nuk.edu.tw
更新日期:2024/4/11 上午 09:16:10

2003/10/20起第 9049277 位訪客
*