有人喝咖啡時什麼都不加,喜歡原始感受的黑咖啡,有人則又加牛奶又加糖。咖啡、牛奶、糖,該依什麼順序放進杯子呢?大部分的人,可能覺得這是什麼問題,會有差別嗎?
近代的下午茶(afternoon tea),發展自英國的維多利亞時代(Victorian era,約由1837至1901年,即維多利亞女王(Queen Victoria,1819-1901)的統治時期)。一開始是英國貴族用來打發下午的時光。貴族多半閒閒沒事幹,聚在一起吃喝聊聊,下午茶結束,晚餐也就快到了。近代則利用那片刻,工作暫停,略微休息,然後繼續衝刺。英國下午茶,不必然有豐盛的食物,但茶通常是有的。現代統計學的鼻祖費雪,曾提到下述故事。在1920年代後期,某日的下午茶時間,有位女士對一群科學家宣稱,奶茶的調製順序,對風味有很大的影響。把茶加進牛奶裡,與把牛奶加進茶裡,兩者喝起來口味大不相同。在座不乏各領域的泰斗,都對這種說法感到可笑。真是班門弄斧,忘了a+b=b+a嗎?兩種混合方式的化學成分,能有什麼差異?但費雪卻很當一回事看待,他設計了一個實驗步驟,包括要準備多少杯茶,及該依照什麼順序給這位女士喝,以對這女士的說法做一檢定。這就是有名的“淑女品茶”(lady tasting tea)實驗,為費雪在引進“實驗設計”概念的著作裡,所舉的例子。
媒體不時報導,有人能以耳朵識字,有人能以手指識字,世上奇人異事還真不少,常不知真假。底下我們便來看,該如何檢定某人能否判斷“奶茶是先放奶或先放茶”?
首先,該準備幾杯奶茶來測試?若只有10杯,似乎太少了。因若每杯有1/2的機率猜中,則全中的機率為1/210=1/1,024,如此大約每1,000人,便有1人能辦到,不算太稀罕。不妨就準備20杯,增加難度,以免太容易“證實”某人有“特異功能”。但也不見得須要求20杯都講對,人總會犯錯,有時我們連好朋友的名字都會喊錯,卻不會承認是忘記他的名字,人們對犯錯是可以有些容忍的。
20杯奶茶,每杯先放奶或先放茶,得採隨機的方式。這可以亂數表,或投擲銅板來決定。要知人的天性大抵是沒有隨機性的,若憑腦海中想到先放什麼就放什麼,雖自以為隨機,所產生的順序,很可能無法通過“隨機性的檢定”。另外,亦不能以為20杯中,就須10杯先放牛奶,且10杯先放茶。若採隨機放,從0杯先放牛奶,至20杯先放牛奶,都有可能。而且全中的機率為1/220=1/1,0242=1/1,048,576,約1百萬分之1。但若受測知道,20杯中恰有10杯先放牛奶,則所有可能性有C(20,10)種。如此全中的機率為1/C(20,10)=1/184,756,機率提高到前者的5倍多。如同樂透彩頭獎號碼的產生,隨機產生的“密碼”,永遠是最難被破解的。
其次來看,要做檢定,便得有虛無假設H0,及對立假設Ha,此處各是什麼?這是在問“能判斷與不能判斷,那一個該放在H0”嗎?若答案為肯定,則因之前並不覺得誰有辦法判斷,且有興趣的是“能判斷”,故該取
H0:不能判斷,Ha:能判斷
才對。放在H0之假設會被保護,不輕易被推翻,而一旦被推翻,便能信心十足的宣佈“某人具備判斷奶茶是先放奶或先放茶的能力”。如果H0與Ha反過來,則很容易接受H0:能判斷,但這樣公佈的結果,恐將沒什麼人採信。H0與Ha看似決定了,只是如何將一項能力數量化?若不量化,就根本不知如何檢定。
以p表每杯說對的機率,X表20杯說對的杯數,則X有B(20,p)分佈。對幾組不同的H0及Ha,我們分別來討論。
(1) H0:p=0.5,Ha:p>0.5。即將“不能判斷”,解釋成“隨機猜”,因此p=0.5;而“能判斷”則解成“比隨機猜準確”,因此p>0.5。顯然拒絕域該取成{X≥k}的型式。我們列出一些p=0.5時,P(X≥k)如下:
P(X≥13)»0.132,P(X≥14)»0.0577,P(X≥15)»0.0207,
P(X≥16)»0.0059,P(X≥17)»0.0013,P(X≥18)»0.0002,
P(X≥19)»0.00002,P(X≥20)»0.0000009。
故若α=0.1,則拒絕域={X≥14};若α=0.05,則拒絕域={X≥15};若α=0.01,則拒絕域={X≥16}。只是在H0及Ha下,即使20杯全說對,仍只能給出“判斷力比隨機猜好”的推論,至於好到什麼地步,卻無從說明,這樣似乎不夠明確。
(2) H0:p£0.6,Ha:p>0.6。會這樣取H0及Ha,是想若正確率未能超過6成,便不算太神奇,說不上能判斷。拒絕域仍該取成{X≥k}的型式。我們列出一些p=0.6時,P(X≥k)如下:
P(X≥15)»0.126,P(X≥16)»0.0510,P(X≥17)»0.0160,
P(X≥18)»0.0036,P(X≥19)»0.0005,P(X≥20)»0.00003。
故若α=0.1,則拒絕域={X≥16},若α=0.05,則拒絕域={X≥17};若α=0.01,則拒絕域={X≥18}。當拒絕H0時,表接受判斷正確率超過6成,比(1)中能給的結論明確些。
(3) H0:p£0.7,Ha:p>0.7。這樣取的原因類如(2)中。拒絕域仍該取成{X≥k}的型式。我們列出一些p=0.7時,P(X≥k)如下:
P(X≥17)»0.1071,P(X≥18)»0.0355,
P(X≥19)»0.0076,P(X≥17)»0.0008。
故若α=0.1,或0.05,皆有拒絕域={X≥18};若α=0.01,則拒絕域={X≥19}。能指出判斷正確率有7成以上,當然更明確了。
(4) H0:p£0.8,Ha:p>0.8。這樣取的原因就不必再說明了。我們列出一些p=0.8時,P(X≥k)如下:
P(X≥18)»0.2061,P(X≥19)»0.0692,P(X≥20)»0.0115。
故若α=0.1,則拒絕域={X≥19};若α=0.05,則拒絕域={X=20}。在拒絕H0時,表接受判斷正確率大於8成,這又更清楚了。
至於H0:p£0.9,Ha:p>0.9的檢定呢?當p=0.9,
P(X≥19)»0.3918,P(X≥20)»0.1216。
可看出除非α取的較大,否則無法拒絕H0。但對這類檢定,α並不宜取太大,否則很容易宣佈找到喝奶茶成精者。那難道就沒有辦法接受判斷正確率大於9成嗎?也是可以,增加測試杯數即可。