國立高雄大學統計學研究所
最新消息 本所簡介 師資介紹 開設課程 教師成果 學生表現 學術演講 入學管道 學生園地 心在南方 表格下載 活動集錦 網路資源 關於我們
本站首頁 本校首頁 英文版
:::心在南方  
主題:統計下凡(三十)
發表者:黃文璋 Email:huangwj@nuk.edu.tw 日期:2022/1/2 上午 10:43:34

30 統計顯著性

俗語說“狗咬人不是新聞,人咬狗才是新聞”。即事情若稀鬆平常,並不值得報導。至於不稀鬆平常,不就是顯著嗎?一向如此,不論統計裡的假設檢定,或媒體上的報導,具顯著性的事件,才會引起注意。我們說過,一事件是否為顯著,乃看其發生機率是否夠小。但我們也曾指出,小機率事件,只要觀測數夠多,或者說小機率碰到大樣本,其發生就不稀奇了。因而在2300萬人的台灣屬顯著事件,從全世界超過79億人(202112月底)來看,可能便屬芝麻小事了;另外,一現今看來極為顯著的事件,若從幾千年人類歷史來看,也可能根本微不足道。

在台灣懷5胞胎便已極稀少了,若全都健康誕生,媒體必然大肆報導。202156日有一則報導,非洲國家馬利(Republic of Mali)的一名婦女,於55日產下9胞胎,其中有54男,且全都平安。新聞裡說,婦女成功生下7胞胎已非常罕見,如今卻是破紀錄的9胞胎。之前的最多胞胎世界紀錄,是2009126日,發生在美國62女的8胞胎。經過漫長12年多才新創的9胞胎紀錄,料想應可維持很久吧!沒想到才過1個月又2天,紀錄便又被打破了。南非(Republic of South Africa)有位婦女,於202167日,平安生下73女的10胞胎。不過其中有5個是自然生產,另5個則藉由剖腹。若加上家中原有的6(包含一對雙胞胎),總計有16個孩子,這家將辛苦了。又,前述8胞胎及9胞胎,都是體外人工受孕(In vitro fertilization),而這位生下10胞胎的媽媽,聲稱她是自然懷孕。不知如何求出,有人宣稱生下6胞胎的機率是47億分之1,一個小的不得了之機率。會散發到世界各地媒體報導的事件,顯著性自然不必說,即其發生機率必定不是普通的小。但世界這麼大,各種顯著事件,仍層出不窮。

職業球賽裡,常有各種新紀錄誕生。以美國職業籃球NBA為例,共30支球隊,除特殊情況(如勞資糾紛或疫情等)外,每隊每年例行賽要打82場。已過世的傳奇人物布萊恩(Kobe Bryant1978-2020),曾立下不少輝煌的紀錄,像是2006年,他創下生涯單場最高的81分,是NBA史上單場得分第二高。即使這樣的頂尖球員,亦曾在2012331日於主場,創下前15次出手皆落空的悽慘紀錄,那是他生涯最差的先發表現。底下我們來看,對布萊恩而言,連15投不進,究竟有多稀罕?

2013年,布萊恩的阿基里斯腱斷裂(torn Achilles tendon),雖健康復原,但在接下來的兩個賽季,又分別因膝蓋及肩膀傷患而報銷,2015-16年的賽季他退休。後期受傷下的數據不計,依媒體報導,布萊恩在NBA的生涯,至連15投不進那場,共出賽1,155場,每場平均出手約23.5次,平均命中率則約為42%。為了簡化,就假設布萊恩每場都出手23次,且每次出手的命中率為42%。以A表布萊恩在一場比賽中,出現“至少連續15次出手落空”的事件,其機率則以P(A)表之。為何考慮“至少”?因並非只有恰好連15次出手全落空才會受到矚目,更多次連續出手落空,將會更令人訝異。A包含連16次、連17次、…,及全部23次出手皆落空的事件。而一串連15次落空,可能發生在始自第1至第15(出手)、始自第2至第16次、…,或始自第9至第23次,共9類情況。連15次落空後,不論進球或不進球,便都無妨,因都歸屬事件A了。但那連15次的前1次出手,必須是進球,否則連續落空的歸類,便要屬於開始更早。例如,對第3類情況,即始自第3至第17次連落空,其第2次出手一定是進球,不會是落空,但第1次出手則可以是進球也可以是落空。從第2類至第9類,那8類都是這種情況。至於第1類,則因始自第1次出手,故並無前1次。又因每次進球機率0.42,落空機率0.58,故得

P(A)=0.5815+8×0.42×0.58150.00123283908

P(A)僅比1000分之1略大些,為布萊恩在特定的某場球賽裡,會發生連續15次出手皆落空的機率。但會為球迷及媒體所重視,當然並不限某場特定的比賽。我們已求出P(A),因此A未發生的機率為1-P(A),此值約為0.99876716,很接近1。由此得在布萊恩生涯1,155場的比賽中,事件A皆未發生之機率為

p=(1-P(A))1,1550.240554792

故在1,155場裡,A至少發生1次的機率為1-p0.759。超過3/4的機率,這一點都不算小了,可說就是等著看到布萊恩連15投不進。最後,在相同的假設下,布萊恩發生“至少連續14次出手落空”的事件,其機率約為0.932,比原先的0.759大了不少;若再放寬,改為連續13次出手落空,對布萊恩而言,這也算罕見了,此機率則約為0.994,已相當接近1了。布萊恩外,NBA當然仍有好幾位能與他相匹比的明星球員。若不限布萊恩,NBA有某位頂級好手,曾至少連15次出手落空,幾乎可說是必然發生了。所以連15次出手皆落空,對某特定大高手,在特定的某場比賽,是相當罕見,但在其球員生涯,或擴大在整個NBA史上,有某位大高手發生,完全無須訝異。

大文豪莎士比亞(William Shakespeare1564-1616)流傳下來的作品,包括38部戲劇、154首十四行詩(Sonnet),及一些長短詩歌,全部作品有80餘萬字。假設要一隻猴子坐在一打字機前敲打,一旦猴子不想打了,就換一隻打。若猴子打了1萬個字母,甚至10萬個,人們不會相信,其中會出現任何有意義的5個字以上的句子。但利用機率理論可求出,若持續不斷地打字,則“遲早”會出現一部連續且完整的莎士比亞全集。當然這“遲早”的時間,可能比我們所能想像的都長。雖發生時間有限(即發生的機率為1),但在我們有生之年,不必期望有可能看到。由於敲打出連續且完整的莎士比亞全集之機率為正(雖微乎其微),由小機率碰到大樣本的概念,知只要時間夠長,莎士比亞全集便將出現。

包含學位論文及投稿論文,近年來不時爆出抄襲事件。雖有罪推定產生爭議,有些大學的研究所,仍訂出“研究生學位論文專業符合及品質保證檢核作業要點”,其中規定研究生“應完成二階段論文原創性比對系統之檢核”,有些大學則要求研究生在畢業前,須先上傳論文,通過防抄襲的偵測軟體檢驗才行。抄襲比對系統,在接收到某論文後,會將該論文之內容,與資料庫內擁有的大量文件比對,然後迅速計算並標示出,可能抄襲的部分、可能的原始出處,及相似文字的百分比。有些防抄襲軟體,只要句子中有連續超過若干個字,與某文件中的內容相同,便會指出來。當然抄襲軟體列出後,仍須人為去檢視,才不會冤枉人。例如,論文中若引用某首詩,或某個定理,即可能有連續幾十個字,與某資料的內容吻合。通常只要在論文中,有講清楚引文的出處,便不至於被認為是抄襲。

幾年前,曾有部美國的電視影集,劇情主要是討論一律師事務所,為客戶打的各種官司。在某一集裡,有人委請律師,對抄襲他的書之出版社提出控告。上了法庭,被告律師答辯,依反抄襲軟體,兩書相似度僅41%,以此佐證他的委託人並未抄襲,或者說即使有抄襲,也不算嚴重。劇中法官支持被告,同意41%的相似比率並不高。原告及其律師當然都很不服氣。要知影印機若列印出的,與原件相似度為95%,則影印機的品質不會被接受;影像與本人相似度,即使高達99%,也會有人不滿意;但補習班考前猜題,命中率若能有30%,就很驚人。所以相似度之高或低,應由發生的難易程度,即依發生機率的大小而定,不能由表面上的相似度百分比之大小來判定。但我們現在應知道了,兩書相似度若達41%,必然是抄襲,絕不該被視為“如有雷同,純屬巧合”。

選舉若得票率差距過小,落選者常會不服,懷疑計票有問題。為讓落選者心服,有些選務機構遂規定,若因得票率(得票數除以有效票數)差距未超過千分之3而落選者,得聲請重新計票。換句話說,千分之3的差距被認為已夠小了,值得為此大費周章,將開票過程重走一遍。只是究竟怎樣的差距才算小?你知道當然不能用票數之絕對差來表示,因如果有效票數才1千,則相差1百票便很多了;而有效票數若達1百萬,則1百票的差異,便不算多。以得票率之差,來表示差異之大小,看起來較合理些,此為前述千分之3差距產生的背景。但以一固定的得票差異比率,來表示差距夠小之門檻,其實一點都不合理。我們已說過多次,以發生機率是否夠小,來反映差距是否夠小,才是合理的方式。

來看投擲一公正銅板n次的情況,且就假設n為偶數。你會預期必得到正反面數各半嗎?應該不會,因即使n=2,得到11反的機率為1/2n=4時,有1/4的機率各得2正及2反。那n愈大,會愈容易得正反面數各半嗎?不會,反而更難!以n=10為例,利用排列組合,可求出得到55反的機率為252/1,024,小於1/4。甚至可以證明,隨著n的增大,愈來愈不容易得正反面數各半,這點可能違反一般人的認知。底下以Sn表投擲n次投擲後,所得之正面數。對公正銅板,Sn的期望值=n/2。所以平均來說,正反面數會出現各半。但對隨機現象,Sn難免有偏差,通常不會剛好是n/2。偏差有多大?Sn的標準差為n1/2/2,此值隨著n之增大而增大。即n愈大時,Sn散佈的範圍將愈大,此範圍之寬度,以n1/2/2的“速度”成長。但相對偏差,即偏差比上投擲數n,則愈來愈小。換句話說,所得正面數的比率Sn/n,其期望值為1/2,至於標準差1/(2n1/2),隨著n之增大而減小。即當n愈大,正面出現率Sn/n散佈在1/2附近,其範圍有愈來愈小的趨勢。因此Sn/n要偏離1/2一“固定距離”的機率將愈來愈小,這便是大數法則的內涵。大數法則針對的是正面出現率Sn/n,而非正面出現的總數Sn,這是有些人未能弄清楚的。

藉檢定銅板是否公正來說明。設投擲銅板n次,且仍以Sn表投擲n次後所得之正面數。先看n=10,000。當銅板為公正,則Sn之期望值為5,000,標準差為50,正面數比反面數多千分之3,即多30,為0.6個標準差。此表得到正面數5,015,反面數4,985。在銅板為公正下,利用中央極限定理,出現正面數至少5,015,比期望值多出0.3個標準差,其機率約為0.3821,可說極易發生,因而不會拒絕銅板為公正。由此即知,設有2候選人,若有效票數為1萬,則兩人得票率差千分之3,是一很小的差異,要求重計票算是合理。其次取n=1,000,000。當銅板為公正,則Sn之期望值為500,000,標準差為500,千分之3的差距為3,000,這相當於6個標準差,便不能等閒視之了。此表得到正面數501,500,反面數498,500。在銅板為公正下。利用中央極限定理,出現正面數至少501,500,比期望值多出3個標準差,其機率約為0.0013,可說極不容易發生,因此將會拒絕銅板為公正。由此即知,設有2候選人,若有效票數為1百萬,則兩人得票率差千分之3,此差異一點都不小,要求重新計票就沒有道理了。由以上討論知,得票率之差距究竟屬於大或小,乃與有效票數的多寡有關。有效票數若夠多,則千分之3的差距便已夠大,用統計術語來說,此差距屬於“顯著”,這時落敗的一方,即使心有不甘,也不該要求重新計票。附帶一提,不難看出,並非將重新計票條件中的得票率差距縮小,如改為未超過千分之2,問題便解決。而讀者現在想必亦可了解,做統計分析時,何以會在意樣本大小,因取樣愈多偏差將愈小。

2004年中華民國總統選舉主要有AB兩組候選人。開票後,A組得6,471,970票,B組得6,442,452票,總有效票數為12,914,422,兩組得票率分別為50.114283%,及49.8857169%。得票數相差29,518票,得票率相差約0.228566%。差不到3萬票,且得票率差不到0.23%(小於千分之3),落敗的B組,百般不服,應不待開召開“專家會議”,便已想要求重新計票了。在檢定銅板是否公正,且n=12,914,422,於銅板為公正下,Sn之標準差約為1,796.83。當正反面數差了29,518個,即出現的正面數,較公正銅板預期出現的次數,多出14,759個,即多出約8.2139個標準差。此機率就不給了,只要想一般偏離3個標準,就已不得了了,如今偏離超過8個標準差,豈能視為偶然?當然不會接受銅板為公正。故雖得票率差不到0.23%,小於千分之3,但此時雙方的差異,是相當顯著的,根本不該要求重新計票。

   暫無回應
 回本區首頁 
  回應總數0  
 
 
  下一頁  
  
 
我要回應
姓 名: 回應前,請先註冊登入
E-mail:
內 容:
驗證碼:  (L38H
 
 
:::
 
*

地  址:811高雄市楠梓區高雄大學路700號
電  話:07-5919362 傳真:07-5919360 e-mail: stat@nuk.edu.tw
更新日期:2024/3/28 下午 01:15:41

2003/10/20起第 8907900 位訪客
*