資料收集到後,下一步便是分析資料。分析之前,可能會先對資料做些整理。譬如說,找出不完整或可疑的資料,然後做些後續的處理。有一項常會先做的資料整理工作,就是數值化。收集到的資料,不見得是數值,可能是紅球、白球,也可能是各種不同的動物。人們一向習慣數值化,或說量化,因此會先將資料數值化。
在學校裡,新生入學,每人會被指定一學號。那一串數字,便包含入學年、系別,及在班上的編號等。有事打電話到銀行的信用卡部門,電話接通後,會先聽到一段語音,依不同需求,要你按不同的數字鍵。加入某餐廳的會員,消費時會有點折扣,只要報上手機號碼,便能查詢是否會員。處處是數字,一切是代號。
有些量化無關緊要,如以1表紅球、2表白球,或倒過來,1表白球、2表紅球,大約沒人會質疑。但有些數值化,卻很令人在意,考試即為一例。考試完全就是一量化,將一個人在某方面的能力,以一數字來代表。但眾所皆知,不同的考試方式、不同的題型、不同的題目,甚至不同的配分,所得到的數值(成績),將完全不同。因此在某種評比標準下,名列前茅者,換個評比方式,可以落居末端。
十二年國教自民國103年起上路,依規定,每個招生區,都須至少有一定比率的名額,提供給免試入學。假設某高中名額為600,卻有800個學生想來就讀,那些人可以順利被錄取?抽籤嗎?群起反對!既然不能抽籤,那只好來比了。各招生區遂訂出各自的“超額比序項目積分表”。那真是非常複雜的一個表。其中在“多元學習表現”項下,有些招生區將獎勵紀錄、服務學習、幹部任期,及社團參與,分別先換算成5級分,然後再依5級8分,4級6.4分,3級4.8分,2級3.2分,及1級1.6分,換成分數。某項活動究竟如何換成級分?為何只給2級,而不是4級?當然會讓考生及家長很計較。令人好奇的是,積分計算標準非得寫那麼一長串嗎?4項級分之和,乘上1.6不是較簡潔?何以超額比序項目積分表,會製成那麼複雜?猜想原因是,一方面企圖塞進太多比序項目,彷彿要讓我們15歲的小孩,成為一全方位的人; 另一方面,以為看表的人數學都不太好,不敢用到小學生都會的乘法對加法的分配律。總之,各項目間,是否有同質性很高者,因此可刪除幾項?以及成績計算方式,可否更有效率些?主事者可能都懶得多花些心思。
參加舞蹈社、參加運動會、到圖書館幫忙等,以往不過屬於個人興趣,說不定還被家長視為浪費時間,如今卻都量化,能換得分數,有助於進高中。以台南區為例,“國中教育會考”(簡稱會考),所考的國文、英文、數學、社會,及自然等5科(另有寫作測驗)的成績,在總積分98分裡,只佔區區25分,而“多元學習表現”之總分,卻高達50分,佔總積分一半以上。對國內過去習慣拼考試的學生與家長,難免不太適應這種不再是考試至上的比序方式。一向意見很多,對什麼入學方式都不滿意的家長,何以事先會接受這種比序辦法?因總是能在琳琅滿目的比序項目中,看到對自家孩子有利的,至於複雜的計分方式,也許讓他們以為其中必有高深的學問,遂不敢置喙。於是便產生號稱為減輕學生負擔,但卻讓學生的負擔比以往重好幾倍的比序辦法。繁瑣加上不覺得客觀的比序成績,讓不少家長,對整個量化過程,怨氣沖天。所以數值化,不該只是圖量化而已,須很謹慎,有一套合理的思維。否則不但爭議將很大,也可能失去欲藉數值化,而看清一些現象的初衷。
有時收集到的資料,已經是數字了,為了一些理由,人們會將之對應到另一數字。例如,早期若考試成績普遍很低,有些教師會用開根號乘以10的方式來調整。即若考x分,換成10x1/2分。採此換算公式的優點是,0分仍是0分,100分仍是100分,所有成績都還是介於0到100間,且高低分順序維持不變。當然也有缺點,就是每人加的分數不同。考25分者變成50分,加的最多。而本來考1分與0分,差別極小,但換算後,前者成為10分,後者仍是0分。又雖每一科的高低順序不變,但若幾個老師都採此調整成績的方式,總分便有差了。例如,假設有A,B二生,考國英數3科。A生分別得81、64及36分,總分181;B生分別得100、100及4分,總分204。原本B生總分較A生高出23分,遙遙領先。但經開根號乘以10的調整後,A生3科成績成為90、80及60分,總分230;B生成績則成為100、100及20分,總分220,反而落後A生10分了。除非重新洗牌是調整成績的目的,否則這種成績變換,便不太合理了。
將數字對應到另一數字的情況很多。以高中生為了進大學所考的“大學學科能力測驗”(簡稱學測)為例。共有國文、英文、數學、自然及社會等5科。本來每科原始總分都至少是100,說是為了不讓考生斤斤計較分數,於是改用“級分制”,每科最高為15級分。級分怎麼算?各科取前1%考生成績的平均,除以15即為每級分之級距。舉例來說明。假設某科總分為100,某年該科到考生共有150,327人,1%為1,503.27,取1,504(採無條件進位至整數)。最高分前1,504人原始成績之平均,假設是93.748…分(先不四捨五入),除以15得6.249…。經四捨五入取至小數第二位,得6.25,則6.25分即為級距。於是原始成績0分為0級分,0.01至6.25為1級分,6.26至12.50為2級分,…,81.26至87.50為14級分,87.51至100為15級分。本來原始成績差0.01,並不是什麼太大的差異,如今卻可能差到1級分。另外,類如之前所舉開根號乘以10的調整方式,假設二考生本來各科程度都在伯仲之間,如今5科原始總分較高的那位,將可能因有4科都剛好差一點點,因而各少1級分,總級分反而低了4級。這樣算是讓考生不斤斤計較分數嗎?
學測除了級分外,各科又都訂出頂標、前標、均標、後標,及底標等五項標準,其中頂標乃成績位於第88百分位數之考生級分。仍設某科到考考生有150,327人。因150,327×0.88=132,287.76,取132,288(採無條件進位至整數)。故從最低分往上數第132,288位考生的級分為頂標。由於依題目難易,考生每科原始成績之分佈,不見得是均勻的。故每1級分有多少百分比之考生,各科、各年度間,差異可能相當大。甚至,這第88百分位數之考生,其原始成績有可能是某級分原始成績最低,亦可能是最高,造成頂標會差到1級。故也將發生因多1位,或少1位缺考生,而使頂標差到1級。缺考生通常不會是該科程度好的學生,如今某人的缺考與否,可影響到若干考生能否通過頂標門檻,未免奇怪。也因此些微的變化,便有可能使級分達到頂標考生的百分比,差異很大。所以同是頂標,不同年度、不同科目,也就不能放在同一天秤比較。
大家應可理解了,本已是數值的學測成績,經級分及頂標等再度數值化,已不知扭曲成什麼意義了。
再回到十二年國教。為了說服力並非很夠的理由,以會考取代之前的“國民中學學生基本學力測驗”(簡稱基測)。會考乃國中畢業生都要考,因此雖宣稱免試,並非真的免試。所考的5科,評分方式分精熟(A)、基礎(B),及待加強(C)3等級,寫作測驗則分6級分。精熟等級之前25%標示A++,前26至50%標示A+;基礎等級亦有類似的標示B++及B+。所以每一學科,從A++至C,相當於分成7級。以往基測時代,每科的“量尺分數” 還曾從60提高到80分,現在每科分7級。學測尚可分15級,會考卻少到只分成7級,不知其中有何大道理?
我們來看美國教育測驗服務社(Education Testing Service,縮寫ETS),為想申請到美加地區,就讀大學或研究所,但母語非英語者,所舉辦的托福考試(Test of English as a Foreign Language,縮寫TOEFL)。早期紙筆測驗(Paper-Based Test,縮寫PBT)時代,滿分677。後來改為電腦托福(Computer-Based Test,縮寫CBT),滿分300。目前採網路化測驗(Internet-Based Test,縮寫iBT),滿分120。成績的範圍都不小。分數範圍要夠大,才易比較。學測及會考,算是比較粗糙的評比方式。這樣的數值化,完全看不出其邏輯。
這是個數值化的時代,但光是數值化是絕對不夠的,要有意義的數值化才行。