國立高雄大學統計研究所-心在南方

:::

:::

主題：46 淑女品茶

發表者：黃文璋　Email:huangwj@nuk.edu.tw

日期：2015/1/15 下午 10:14:05

有人喝咖啡時什麼都不加，喜歡原始感受的黑咖啡，有人則又加牛奶又加糖。咖啡、牛奶、糖，該依什麼順序放進杯子呢？大部分的人，可能覺得這是什麼問題，會有差別嗎？

近代的下午茶(afternoon tea)，發展自英國的維多利亞時代(Victorian era，約由1837至1901年，即維多利亞女王(Queen Victoria，1819-1901)的統治時期)。一開始是英國貴族用來打發下午的時光。貴族多半閒閒沒事幹，聚在一起吃喝聊聊，下午茶結束，晚餐也就快到了。近代則利用那片刻，工作暫停，略微休息，然後繼續衝刺。英國下午茶，不必然有豐盛的食物，但茶通常是有的。現代統計學的鼻祖費雪，曾提到下述故事。在1920年代後期，某日的下午茶時間，有位女士對一群科學家宣稱，奶茶的調製順序，對風味有很大的影響。把茶加進牛奶裡，與把牛奶加進茶裡，兩者喝起來口味大不相同。在座不乏各領域的泰斗，都對這種說法感到可笑。真是班門弄斧，忘了a+b=b+a嗎？兩種混合方式的化學成分，能有什麼差異？但費雪卻很當一回事看待，他設計了一個實驗步驟，包括要準備多少杯茶，及該依照什麼順序給這位女士喝，以對這女士的說法做一檢定。這就是有名的“淑女品茶”(lady tasting tea)實驗，為費雪在引進“實驗設計”概念的著作裡，所舉的例子。

媒體不時報導，有人能以耳朵識字，有人能以手指識字，世上奇人異事還真不少，常不知真假。底下我們便來看，該如何檢定某人能否判斷“奶茶是先放奶或先放茶”？

首先，該準備幾杯奶茶來測試？若只有10杯，似乎太少了。因若每杯有1/2的機率猜中，則全中的機率為1/2¹⁰=1/1,024，如此大約每1,000人，便有1人能辦到，不算太稀罕。不妨就準備20杯，增加難度，以免太容易“證實”某人有“特異功能”。但也不見得須要求20杯都講對，人總會犯錯，有時我們連好朋友的名字都會喊錯，卻不會承認是忘記他的名字，人們對犯錯是可以有些容忍的。

20杯奶茶，每杯先放奶或先放茶，得採隨機的方式。這可以亂數表，或投擲銅板來決定。要知人的天性大抵是沒有隨機性的，若憑腦海中想到先放什麼就放什麼，雖自以為隨機，所產生的順序，很可能無法通過“隨機性的檢定”。另外，亦不能以為20杯中，就須10杯先放牛奶，且10杯先放茶。若採隨機放，從0杯先放牛奶，至20杯先放牛奶，都有可能。而且全中的機率為1/2²⁰=1/1,024²=1/1,048,576，約1百萬分之1。但若受測知道，20杯中恰有10杯先放牛奶，則所有可能性有C(20,10)種。如此全中的機率為1/C(20,10)=1/184,756，機率提高到前者的5倍多。如同樂透彩頭獎號碼的產生，隨機產生的“密碼”，永遠是最難被破解的。

其次來看，要做檢定，便得有虛無假設H₀，及對立假設H_a，此處各是什麼？這是在問“能判斷與不能判斷，那一個該放在H₀”嗎？若答案為肯定，則因之前並不覺得誰有辦法判斷，且有興趣的是“能判斷”，故該取

H₀：不能判斷，H_a：能判斷

才對。放在H₀之假設會被保護，不輕易被推翻，而一旦被推翻，便能信心十足的宣佈“某人具備判斷奶茶是先放奶或先放茶的能力”。如果H₀與H_a反過來，則很容易接受H₀：能判斷，但這樣公佈的結果，恐將沒什麼人採信。H₀與H_a看似決定了，只是如何將一項能力數量化？若不量化，就根本不知如何檢定。

以p表每杯說對的機率，X表20杯說對的杯數，則X有B(20,p)分佈。對幾組不同的H₀及H_a，我們分別來討論。

(1) H₀：p=0.5，H_a：p>0.5。即將“不能判斷”，解釋成“隨機猜”，因此p=0.5；而“能判斷”則解成“比隨機猜準確”，因此p>0.5。顯然拒絕域該取成{X≥k}的型式。我們列出一些p=0.5時，P(X≥k)如下：

P(X≥13)»0.132，P(X≥14)»0.0577，P(X≥15)»0.0207，

P(X≥16)»0.0059，P(X≥17)»0.0013，P(X≥18)»0.0002，

P(X≥19)»0.00002，P(X≥20)»0.0000009。

故若α=0.1，則拒絕域={X≥14}；若α=0.05，則拒絕域={X≥15}；若α=0.01，則拒絕域={X≥16}。只是在H₀及H_a下，即使20杯全說對，仍只能給出“判斷力比隨機猜好”的推論，至於好到什麼地步，卻無從說明，這樣似乎不夠明確。

(2) H₀：p£0.6，H_a：p>0.6。會這樣取H₀及H_a，是想若正確率未能超過6成，便不算太神奇，說不上能判斷。拒絕域仍該取成{X≥k}的型式。我們列出一些p=0.6時，P(X≥k)如下：

P(X≥15)»0.126，P(X≥16)»0.0510，P(X≥17)»0.0160，

P(X≥18)»0.0036，P(X≥19)»0.0005，P(X≥20)»0.00003。

故若α=0.1，則拒絕域={X≥16}，若α=0.05，則拒絕域={X≥17}；若α=0.01，則拒絕域={X≥18}。當拒絕H₀時，表接受判斷正確率超過6成，比(1)中能給的結論明確些。

(3) H₀：p£0.7，H_a：p>0.7。這樣取的原因類如(2)中。拒絕域仍該取成{X≥k}的型式。我們列出一些p=0.7時，P(X≥k)如下：

P(X≥17)»0.1071，P(X≥18)»0.0355，

P(X≥19)»0.0076，P(X≥17)»0.0008。

故若α=0.1，或0.05，皆有拒絕域={X≥18}；若α=0.01，則拒絕域={X≥19}。能指出判斷正確率有7成以上，當然更明確了。

(4) H₀：p£0.8，H_a：p>0.8。這樣取的原因就不必再說明了。我們列出一些p=0.8時，P(X≥k)如下：

P(X≥18)»0.2061，P(X≥19)»0.0692，P(X≥20)»0.0115。

故若α=0.1，則拒絕域={X≥19}；若α=0.05，則拒絕域={X=20}。在拒絕H₀時，表接受判斷正確率大於8成，這又更清楚了。

至於H₀：p£0.9，H_a：p>0.9的檢定呢？當p=0.9，

P(X≥19)»0.3918，P(X≥20)»0.1216。

可看出除非α取的較大，否則無法拒絕H₀。但對這類檢定，α並不宜取太大，否則很容易宣佈找到喝奶茶成精者。那難道就沒有辦法接受判斷正確率大於9成嗎？也是可以，增加測試杯數即可。

暫無回應

回本區首頁

回應總數0

姓名：	回應前，請先註冊或登入。
E-mail：
內容：
驗證碼：	（6F00）

:::

地　　址：811高雄市楠梓區高雄大學路700號
電　　話：07-5919362 傳真：07-5919360 e-mail: stat@nuk.edu.tw
更新日期：2024/4/11 上午 09:16:10

2003/10/20起第

9059268

位訪客