7 關於學測級分的探討(四)
考完試,看分數普遍太低,教師有時會做一些調整,也就是將分數給個轉換。以開根號乘以10的方式來調整,在早期很常見。即將x分,換成10x1/2分。此公式的優點是,0分仍是0分,100分仍是100分,所有成績都仍介於0到100間,且高低分順序維持不變。當然也有缺點,就是每人加的分數不同。考25分者變成50分,加的最多。而本來考1分與0分,差別極小,但換算後,前者成為10分,後者仍是0分。又雖每一科的高低順序不變,但若幾個老師都同樣採此調整成績的方式,則總分便有差了。例如,假設有A,B二生,考國英數3科。A生分別得81、64及36分,總分181;B生分別得100、100及4分,總分204。原本B生總分較A生高出23分,遙遙領先。但3科都經開根號乘以10的調整後,A生成績分別為90、80及60分,總分230;B生則分別為100、100及20分,總分220,反而落後A生10分。這種例子極多,讀者可自行嘗試舉一些。
如果想知葡萄跟芒果何者較營養,則該分析新鮮的葡萄及芒果之成分,而非比較被加工過的葡萄乾與芒果乾,此為眾所皆知的道理。大學校系在辦理甄選時,可依自己學系的屬性,或招生策略的考量,對學測的某些科目不採計、依成績採計,或加重計分,看起來很有自主性。只是各校系拿到的,並非各科原本的分數,而是被加工過的成績,即級分,以及意義不明卻用來當門檻的5標。為何不讓各校系自行對原始分數做判斷?非得依被轉換過的成績?為何不能自行訂定門檻?而只能依5標?大考中心未免太越俎代庖了!本來考題及配分都是大考中心百分之一百決定的,大考中心自己卻覺得成績不能用來評比,必須轉換。轉一次成為級分,再換一次弄出5標,背後究竟有何大道理來支持其作法?
雖我們已指出級分及5標設計的若干缺失,底下各再給一個。
大考中心由於依分數等距,而非依人數百分比,將原始分數轉換成級分,造成考生成績排名可能超乎想像的大翻轉。假設有A,B二生,皆參加104學年度的學測。國文、英文、數學、社會及自然等5科,A生原始分數各得82、88、100、126及116,總分512;B生原始分數各得83、89、92、127,及117,總分508,A生優於B生。由表8,A生5科級分各為14、14、15、14,及14,總級分71;B生5科級分各為15、15、15、15,及15,總級分75。A生原始總分比B生多4分,其中有一科多8分,另4科各少1分。高的那科多很多,低的那4科都才少些許,原本A生不會被視為比B生差一截,甚至會覺得A生略好些。但換算成級分後,B生興高采烈,因他得到滿級分。至於原始總分較高的 A生,反而比B生少了4級分,能選的校系差很多了,有點氣餒。不是為了讓學生不要斤斤計較分數,才採級分制,現在看來,怎能不計較呢?總分較高,總級分卻低了4級,還不是最離譜的。假設C生5科原始分數各得98(最高分)、69、71、144及128,總分510。5科中有3科考到最高分,其中有兩科還滿分,相當不容易。但由表8,C生5科級分各為15、11、11、15,及15,總級分67。C生原始總分較B生高,但卻足足少了8級分,能選的校系與B生完全不一樣了,黯然神傷。怎會這樣?要知有些學系,沒有75級分,是通不過申請入學第一階段的篩選。只是能通過真的就是最頂尖?67級分一定遠不如75級分?現在看起來都未必。
大考中心依百分位數來訂出5標的級分,其百分位數是從下往上數,但其實從上往下數應較恰當。本來引進百分位數來訂5標,如前所述,已屬匪夷所思了。採從下往上數,更加重其不合理性。什麼意思?
假設自然的到考生有150,250位。因150,250×0.88=132,220,故依現行作法,從最低分往上數之第132,220位到考生的級分便為頂標。如果採從上往下數呢?即因150,250×0.12=18,030,故將從最高分往下數之第18,030位到考生的級分訂為頂標。依第一種算法,往上數之第132,220位到考生,為從最高分往下數之第18,031(=150,250-132,220+1)位。兩種作法,所得頂標那位指標學生,有一點小差別,前後差一位。不過這是因乘出來是整數,若有進位算出來便會一樣。舉例來看。如前假設數學的到考生有150,327位。150,327×0.88=132,287.76,進位得132,288。此為從最高分往下數之第18,040(=150,327-132,288+1)位,又因150,327×0.12=18,039.24,進位後再度得到18,040。即此時從下往上或從上往下數,會得到同一位頂標的指標考生。無論如何,你可能覺得反正差異不大,固定一種算法來訂5標即可。但底下將說明,採從上往下數該是較合理的。
對於學測,大考中心雖宣稱“考生五科都必須應考”,但實際執行時,各科都會有些缺考。現假設自然的150,250位到考生中,15、14及13級分,各有6,001、12,029位,及13,243位。得到15及14級分者,合計18,030位,恰占12%。另一方面,由0至13級分共132,220(=150,250-18,030)位,占了88%。則依目前算法,自然頂標為13級分。可看出此時頂標的那位指標考生,為13級分的“頂”,至於自然達到頂標,為拿到13、14及15級分者,其人數共有6,001+12,029+13,243=31,273,約占自然到考生的20.81%(=31,273/150,250),遠高於預定的12%。現假設有位自然一向很不好的考生,於第二天考完社會後,已快耗竭了,心想準備申請的校系都不採計自然,於是把心一橫,不管老師及爸媽的叮嚀,排在最後一考科的自然不考了。如此一來,自然的到考生成為150,249位。如此一來,150,249×0.88=132,219.12,進位得132,220。因少了1位到考生,由0至13級分也較原本少掉1位,即共132,219位。於是第88百分位數的那位指標考生,往上跳一位,變成14級分的“底”。
各科缺考者通常是該科較差的學生,如今因多了一位屬於底層的缺考生,竟然影響到上層,使頂標提高1級分。原先達到頂標的考生有20.81%,如今只有12%。這一來,將造成很多學生因自然未達頂標,而通不過某些校系的門檻了。某考生的一念之間,影響竟然如此大,寧非怪事?難道是蝴蝶效應(butterfly effect)?如果各標的計算,是從最高分往下分別數12%、25%、…,就不會有這種大起大落的現象了。
在統計裡,對收集到的資料,一直攜帶著常覺累贅,而資料太多後,也不易了解其內涵。如何能達到資料減縮(data reduction)的目的,並使有用的資訊毫無損失?這便引進了充分統計量(sufficient statistic)的概念。例如,欲估計某銅板出現正面的機率p。一個辦法就是反覆投擲n次,各次的結果分別以X1,X2,…,Xn表之,其中Xi=1,表第i次得正面,Xi=0,表第i次得反面,i=1,2,…,n。於是有一串0,1的數字。對估計p,直觀上只要知道總共之正面數Sn=X1+X2+…+Xn便夠了,而不必知道究竟那些次得正面,及那些次得反面。Sn便為一個充分統計量。即有了Sn後,就不用再知道X1,X2,…,Xn各是多少了,資料遂大幅減縮。但大考中心提供的級分,卻對擬了解學生程度,失去很多重要的資訊。他們為何如此做呢?