國際學生能力評估計畫(Programme for International Student Assessment,縮寫PISA),是經濟合作與發展組織(Organisation for Economic Co-operation and Development,縮寫OECD)所執行的一項計畫。自2000年開始,每3年一次,對世界各地15歲學生做學習水平的測驗。測驗的科目有數學、科學及閱讀等三科。目前全世界約有65個國家或地區參加測試。台灣自2006年首度參加此測驗,數學科的平均成績便名列第1。2009年,二度參加,不知是否迴歸效應,數學排名降至第5。那年首度參加的上海及新加坡,則分別名列第1及第2。很重視此項測驗的教育部,認為由第1跌到第5,成績“大幅下滑”,事態嚴重。於是找些大學數學教授,在全國各地,對國中數學教師進行輔導。不知算不算輔導有成,2012年,數學排名升至第4。
在前述輔導過程中,主辦單位提供的數學樣本試題裡,曾有如下一道統計題目:
電視主播呈現了下圖並報導:
從圖表顯示,從1998年到1999年搶劫案數量有巨幅的上升。
你認為這位主播對於上圖的解釋是否合理?請寫出一個理由來支持你的答案。
樣本試題裡,列出一些得到滿分學生所給的理由:
1. 不,不合理。指出我們看到的只是整個圖表的其中一小部分。
2. 不合理,須顯示整個圖表。
3. 我不認為那是合理的詮釋,因為如果顯示全圖的話,便能看到搶劫案的數目只是輕微上升。
4. 不合理,因為他只用了圖表上方的小部分。如果看到全圖由0到520的情況,便知道上升幅度不是那麼大。
5. 不,那只是因為該圖表讓人覺得數字巨幅上升。看數字增加並不多。
由圖表可看出,1998年及1999年的搶劫案,各有508及516件,相差8件。圖表中將縱軸503以下都省略,使能看得更清楚些。於是原本高度相差的比例(516-508)/508,才約1.57%,並不懸殊。但在圖表中,卻顯示出1999年搶劫案件的高度,為1998年的兩倍以上。台灣15歲的學生,都已身經百戰了,不少也相當靈巧,一眼看穿出題者之用意,輕易寫下出題者要的理由,因而得到滿分。
學生在這題得到滿分,是件好事嗎?並不盡然。被歸入統計的這道題目,其實只有數學的味道。因不論命題或答題者,其思維最多僅到百分比,而缺乏隨機性的考量。會再多這類號稱統計的題目,只表示學生懂些簡單的數學。至於統計素養如何,並無從得知。
搶劫案上升,到底能不能算巨幅,並非只看增加的搶劫案件數,或增加的百分比之大小。更該在意的,其實是會增加這麼多的件數,其發生機率之大小。知道看相對差異,雖比只知看絕對差進一步,但仍不夠。
以男子100公尺短跑的世界紀錄為例。1968年的紀錄為9.95秒,2009年則為9.58秒,乃外號“閃電柏特”的牙買加(Jamaica)選手柏特(Usain St. Leo Bolt,1986-)所創,此紀錄維持至今。每10年平均推進不到0.1秒,因此若在某次比賽中,有選手將紀錄推進0.15秒,雖數字0.15很小,且進步的百分比0.15/9.58,尚不到1.57%,但媒體極可能會大肆報導,認為是“巨幅進步”,因這樣的突破,實在太困難了。而且之前男子100公尺世界紀錄史上,最大幅度的刷新為0.11秒,正是由柏特所創,打破他自己保持的原世界紀錄9.69秒。而眾所皆知,人的體能總有極限,尤其是短跑,能進步的空間愈來愈有限。將來若能一次快上0.15秒,恐怕真會轟動全球。簡單講,一事件究竟值不值得大驚小怪,乃依發生機率之大小。如果搶劫案的件數很穩定,每年都差不多是508件左右,則某年一口氣增加8件,自然可被視為巨幅上升。至於若搶劫案的件數年年波動很大,則增加8件,可能便沒什麼大不了。
對於前述PISA考題,底下我們給兩個模型,以進一步說明。
假設每年搶劫案之數量X,可以B(520,0.977)分佈當做近似的模型。即有二項分佈,參數n,p分別為520,及0.977。故期望值為
E(X)=np=508.04,
至於標準差則為
[Var(X)]1/2=[np(1-p)]1/2»3.148。
由於np,及n(1-p)皆大於5,利用常態分佈來近似二項分佈,得
P(X≥516)»P((X-np)/[np(1-p)]1/2≥(516-508.4)/3.418)»P(Z≥2.329)»0.0099。
即搶劫案發生至少516件的機率,以常態近似得約略小於0.01(實際值約為0.009939)。這機率夠小了,亦即搶劫案數量增加8件,算是罕見了,說是巨幅上升並不為過。因此主播的解釋,應屬合理。
其次,假設每年搶劫案之數量X,可以B(1,000,0.508)當做近似的模型。即有二項分佈,參數n,p分別為1,000,及0.508。如此期望值為
E(X)=np=508,
而標準差則為
[Var(X)]1/2=[np(1-p)]1/2»15.809。
標準差差不多高達16,如今增加8件,不過約半個標準差,因此這樣的上升,乍看之下,便算不了巨幅。來細算一下。由於np,及n(1-p)皆大於5,仍利用常態分佈來近似二項分佈,得
P(X≥516)»P((X-np)/[np(1-p)]1/2≥(516-508)/15.809)»P(Z≥0.5060)»0.3064。
發生機率約略大於0.3(實際值約為0.3064,與常態近似所得很接近),並不小的機率,故如此搶劫案數量的上升,乃屬稀鬆平常。即主播的解釋,可說相當誇大。
在“唐詩三百首”裡,有首劉禹錫(772-842)的“烏衣巷”:
朱雀橋邊野草花,烏衣巷口夕陽斜。
舊時王謝堂前燕,飛入尋常百姓家。
鳥衣巷曾是奠定東晉政權的王導(276-339),及運籌帷幄獲得淝水之戰勝利的謝安(320-385),兩大望族所居住的地方。王謝兩家沒落後,燕子仍飛來,但如今野草叢生,昔日的繁華景象已不復存在。而仍居此地者,不管是否王謝的後人,都早已是尋常百姓了。這是一首懷古詩,由繁華鼎盛,至荒涼殘照,令劉禹錫不勝唏噓,寫下這首流傳千古的詩。但若看多了“眼看他起朱樓,眼看他宴賓客,眼看他樓塌了”後,也許便覺這類事不過尋常而已,便不會再如此感慨了。
有些事常見到,很尋常。有些事則不太常見,我們會以不尋常,或“顯著”來描述。如顯著進步,差異顯著,成果顯著。表示這樣的進步,這樣的差異,或這樣的成果,不是很容易發生。尋常與顯著,都依發生機率大小而定。發生機率不低的事件發生,不會引人注意,因很尋常。發生機率很低的事件發生,就會引人注意,因這是一顯著事件。如同警方辦案及新聞報導,通常會放過尋常事件,而盯緊顯著事件。統計學裡,做決策時,也是在乎顯著事件。顯著事件發生,表示其間很可能有不對勁。對統計顯著性有興趣的讀者,可參考黃文璋(2005)一文。
參考文獻
1. 黃文璋(2005). 統計顯著性. 數學傳播季刊, 29(4): 29-38.