國立高雄大學統計學研究所
最新消息 本所簡介 師資介紹 開設課程 教師成果 學生表現 學術演講 入學管道 學生園地 心在南方 表格下載 活動集錦 網路資源 關於我們
本站首頁 本校首頁 英文版
:::心在南方  
主題:33 淺談估計
發表者:黃文璋 Email:huangwj@nuk.edu.tw 日期:2014/11/28 下午 03:48:11

現況可估計嗎?曾有高中數學教師,提出下述問題:抽屜中有3個蘋果及2個橘子,老師拿了1個橘子放背後,問學生是蘋果的機率為何?明明確定是橘子,怎會要人求是蘋果的機率?這位數學教師感到很納悶,百思不解。

上述求機率的問題,便是一種估計。舉凡各種猜測、預測及預估,都是估計,只要未知便可估計。估計錯誤,是著名歌手及演員謝霆鋒(1980-),年僅15歲,慘綠少年時,所寫的第一首歌,其中有句歌詞,“計算自己情感,偏偏估計錯誤”。自己的情感,當然是現況,不但可以估計,而且,雖是自己的,仍會估計錯誤。有位婦人懷孕,不時有朋友由她肚子的形狀,或懷孕後身心的反應,來估計她會生男或生女。有人估男,有人估女,還有人說會生雙胞胎。這婦人對眾人的估計,都僅笑而不語,不會隨他們起鬨。她早已由醫生那兒得知,懷的是女孩,這些人明明瞎猜,卻個個都顯然很有把握的樣子。考前猜題也是一樣。明天考試,題目都已印好了,臨時抱佛腳的學生,群聚在教室,此起彼落地呼叫這題必考,因老師上課一再強調,那題不可能考,因老師上課一下子便帶過去了。走過教室的老師,聽到學生在估計他的命題習性,當然覺得很可笑。不論題目是否已經出好,學生只要不知道,便皆可估計那些題會考。但對已知考題的老師,去估計某題會考的機率,便沒有意義。

確定的事可以估計,這種例子向來不少。在金庸(1924-)所著“天龍八部”的第八回,為了救段譽,拈花寺的黃眉大師,與號稱“天下第一惡人”的段延慶比試圍棋。誰先下如何決定?黃眉僧說“請你猜猜老僧今年的歲數,是奇是偶?猜得對,你先下;猜錯了,老僧先下。”段延慶說“我便猜中,你也要抵賴。”黃眉僧說“好罷!那你猜一樣我不能賴的。你猜老僧到了七十歲後,兩隻腳的足趾,是奇數呢,還是偶數?”今年歲數,是個定值,可以猜測。七十歲後,兩腳足趾數,是奇是偶?這是未來,可以預測。但足趾數會變嗎?就讓讀者自行去翻閱原書了。

一旦歲數,及兩腳足趾數等都可以估計,那就真沒什麼不能估計了。

對於前述蘋果及橘子的問題,學生若沒有其他資訊,只好假設老師是從總共5個水果中,隨機地取1個,因此將答“會是蘋果的機率為3/5。之所以假設老師是隨機地取,乃是沒有辦法中的辦法。這種基於“相同的可能性”,是一種很常採用的預測方法。一般人在參加國家考試,或應徵工作前,想知道勝算,往往會以往年錄取名額與報名人數之比,做為若報名,會被錄取機率之估計。這也是當沒有其他資訊時,遂假設每人機會均相等。不過,如果考生清楚自己程度,也知道自己準備情況,他自然便不必以相同的可能性,來估計自己的錄取機率。

有人說,自然生育裡,生雙胞胎的機率為1/90。這機率是怎麼估計出來的?想必是統計全國(或全世界)總共多少次生育,其中有幾次是雙胞胎,再將後者除以前者,而得到的結果。這便是採用相對頻率的觀點。但不時有人感到迷惑:只生產一次,要嘛雙胞胎,要嘛非雙胞胎,機率不是1就是0,怎會是1/90?其實這仍屬沒有辦法中的辦法。醫學上曾有報導,“伴侶中若有雙胞胎基因的話,生雙胞胎的機率將提高”。就算這是真的,但若不知雙方誰有此基因,對任一次生產,會是雙胞胎的機率,就只好以1/90估之。估計的準確性,如同機率值,從來不是1次能見真章。長期下來,醫院的接生紀錄中,將約1/90的比例為雙胞胎,這是1/90的意義。棒球選手上埸擊出安打的機率,以過去打擊率來估計,也是相對頻率的觀點。對前述蘋果及橘子的問題,假設老師持續地從抽屜中拿一水果放背後問學生,每次問完便放回去。有位細心的學生,紀錄老師每次所拿的是蘋果或橘子。結果發現前30次中,有20次老師拿的是橘子,遂猜想老師並非隨機地取,而有2/3的機率拿到橘子。所以如何估計,並非一成不變。

以相對頻率的觀點來估計,便發展出“動差估計法”(method of moments),背後的理論基楚,則是大數法則。只要可重複觀測的試驗,對可經由取期望值得到的參數,便能用動差估計法。

上課走進教室,老師發現黑板上有一些亂七八糟的圖畫。誰畫的?無人承認。班上40位學生,從何查起?一個個問嗎?非也。老師先找平常最調皮的那位來。這位學生大呼冤枉,說老師對他有偏見。只是不先找最調皮者,要找誰呢?最調皮的不先找,而先找其他人,學生會覺合理嗎?相同的可能性在這裡並不適用,老師並不以為會是任一位學生的機率,都同為1/40。警方辦案常也是如此,從有前科、有地緣關係、案發前後經過現場的人等,開始調查。看到一現象,倒過來想,究竟什麼原因,使此現象的發生最容易(即機率最大)?這是我們估計時,常可能會有的一種思維。此思維就發展出最大概似法(method of maximum likelihood)。例如,欲估計某銅板正面出現的機率p,我們採最大概似法。先持續投擲n次,假設得到x次正面。然後問:p的值為何,方使得到x次正面的機率最大?利用微積分求極值,將得到p之最大概似估計值為x/n

不同的估計法,有時可能會導致相同的估計值。這並不足為奇,就像社會上若發生某重大命案,幾個單位分頭偵辦,結果皆指向同一嫌犯,不過就是英雄所見略同。

一個好的估計法,常會反映我們做決策時的某種思維。除了上面提到的幾種估計法,還有一種常見的貝氏作法(Bayesian approach)。對銅板正面出現的機率p,一般皆將p當做一未知的定值。但貝氏學派(Bayesian),卻視p有一機率分佈,所謂事前分佈(prior distribution)。事前分佈為一種主觀的分佈(subjective distribution),每人看法可以不同。譬如說,有人以為銅板為政府發行,不至於太偏頗,p應在區間[0.45,0.55]均勻分佈。經投擲n次,得到x個正面後,這時對p的看法可以改變。於是求出p的事後分佈(posterior distribution),算是p經修正後的分佈。這有如人們看到一些跡象後,修正原先的看法,屬於一種科學的精神。據事後分佈,便可得到p之貝氏估計量(Bayes estimator)。“貝氏”名稱之由來,是因事後分佈乃利用貝氏定理而得。

我們想估計的,並不總是如銅板正面出現的機率,這麼單純的一個參數,有時連分佈都可估計。又估計的方法很多,不限以上幾個。此處只是很基本的介紹,有興趣進一步了解者,可參考黃文璋(2007)一文,及一般的統計教科書。

參考文獻

1. 黃文璋(2007). 統計裡的估計. 數學傳播季刊, 31(2): 3-20.

   暫無回應
 回本區首頁 
  回應總數0  
 
 
  下一頁  
  
 
我要回應
姓 名: 回應前,請先註冊登入
E-mail:
內 容:
驗證碼:  (76FN
 
 
:::
 
*

地  址:811高雄市楠梓區高雄大學路700號
電  話:07-5919362 傳真:07-5919360 e-mail: stat@nuk.edu.tw
更新日期:2024/4/11 上午 09:16:10

2003/10/20起第 9061539 位訪客
*