國立高雄大學統計學研究所
最新消息 本所簡介 師資介紹 開設課程 教師成果 學生表現 學術演講 入學管道 學生園地 心在南方 表格下載 活動集錦 網路資源 關於我們
本站首頁 本校首頁 英文版
:::心在南方  
主題:談統計誤差(二)
發表者:黃文璋 Email:huangwj@nuk.edu.tw 日期:2016/6/16 上午 12:13:14

2. 誤差難免

基於合理的懷疑,在12怒漢中,12陪審員,從開始一面倒的認為被告有罪,產生大逆轉。原本千夫所指的少年,也就被判無罪釋放。結局固然快樂,但真相是否就此大白?其實仍屬未知。因雖不能說買刀者都準備要殺人,但買的刀與凶刀同一款式,仍是一不容忽視的疑點。至於跛腳老先生,跟住對面女士的證詞是有瑕疵。不過也可能是兩個缺乏社會經驗的人,為了強化證詞之可信度,對所見情境,畫蛇添足下,反而產生漏洞,變成難以採信。這種情況,並非不尋常。甚至還有因為多事,卻成自證己罪者。清末劉鶚(1857-1909)老殘遊記一書,在初編1520回,有一剛弼斷案的故事,便為一例。

在山東齊河縣的齊東鎮,發生一起賈府一家大小13被人用毒藥謀害的命案,震驚全縣。魏氏父女,因涉嫌被收押。山東撫臺,特地指派一向以清廉著稱的剛弼來查案。魏家管事,見主人吃冤枉官司,求助一胡姓舉人。胡舉人與剛弼相識,覺得這不過小事一樁,欣然接受委託。見到了剛弼,胡舉人先奉上魏家管事交給他的1千兩銀票。剛弼於了解來意後1條人命本值1千兩銀子13條共13但既然胡舉人來,看他面上,可減半算,就65百兩。且銀子不急只須先寫個憑據。還要胡舉人向魏家管事說明,65百兩是怎麼得出來的。胡舉人連連答應,隨後寫了一封信,連同管事提供將支付55百兩(已送了1千兩)的憑據,一起送至縣衙門。

隔日剛弼升堂會審,拿出1千兩銀票、55百兩的憑據,以及胡舉人的信,要魏氏父女招供。一切環環相扣,斷定13個人,就是他們所殺害,不招就用刑。待最後水落石出,找到真凶,還了魏氏父女清白,剛弼尚百思不解。如果明明無辜,有什麼必要行賄?還就同意65百兩銀子,沒有爭辯根本連1人也未殺害,豈來500乘上13

書中透過一位白太守來說穿此迷團,其實並沒什麼太深奧的道理,不過就是鄉下人沒見識。書上說,魏家管事是個愚忠的老實人,眼見主人吃了冤枉官司,擔心被屈打成招,情急之下,自做主張奔走籌款,以營救主人。只要能救出主人,一切聽命行事,根本未多想是否被設計了。而雖是舉人,飽讀詩書,卻不過是冬烘先生一個。見出面助人有效,欣喜之下,修書感謝,順便結個文字緣,不料反留下企圖買通官員的證據。

不時會聽到人們抱怨豈有此理或訝異地說怎麼可能?顯然天下事,並非都盡合理,而不可能的事,也常發生。如同人們所認知,統計學之一主要原理,是從所得的結果,來驗證前提是否可接受。當看到不合理的現象發生,的確該提高警覺,探究到底什麼原因,才造成此現象出現。但卻不可如前述剛弼,過度執所見到的不合理,認定就只有一個原因,而不再想其他可能性。至於所謂不可能,其實就是小機率事件。而不論事件的機率多小,只要觀測次數夠多,就不必訝異其發生。樂透彩中頭獎的機率夠小了吧怎麼有人中?作弊嗎未必,賣出那麼多張,頭獎開出來,就幾乎是必然了。

Lewis Carroll(1832-1898)所著愛麗思夢遊仙境”(Alice's Adventures in Wonderland)一書中,愛麗思(Alice)曾說“Sometimes I've believed as many as six impossible things before breakfast.早餐前就看到6件不可能的事?怎麼會這樣?愛麗思認為一點都不難,只要多練習即可。各式各樣的小機率事件那麼多,若細加留意,總會發現有某件冒出來。有那些被視為不可能,卻發生的事件?事實上處處都是,底下給個例子。

NBA(National Basketball Association)是北美男子職業籃球組織。擁有30支球隊,分屬東西兩聯盟(conference)。每聯盟有3個分組(division),每個分組有5支球隊。總共30支球隊中,有29隊位於美國,另1隊來自加拿大。NBA每年的正式賽季,從11月初開始。先進行例行賽(regular season),每支球隊都要完成82場比賽。隔年4月底,開始打季後賽(playoffs)。每聯盟的15支球隊中,皆有8隊能參加季後賽,包括例行賽3支分組冠軍(由勝率決定),及另挑出勝率最高的5隊。有超過一半的球隊能打季後賽,不算很難,值得一拼。因此各支球隊,在每年的例行賽中,一個目標,就是打進季後賽。一旦這個目標達到,便有如那年的表現及格了。季後賽先在兩聯盟裡,各自強弱抓隊廝殺,採74勝淘汰制。3輪後,兩支聯盟冠軍產生,爭奪年度總冠軍。能獲總冠軍,那真是莫大的榮耀,可幾十年講個不停。但也相當不容易,季後賽得闖過4關,共贏16場。

2015-16 NBA例行賽,最強的球隊,應屬西區的金州勇士隊(Golden State Warriors金州是加州的別名)。勇士隊前一年才獲得睽違整整40年的總冠軍(上一次奪冠是1974-75球季)。氣勢延續下來,這一年的例行賽,戰績一路長紅,倍受矚目。最終取得739敗,勝率超過89,打破20年前,1995-96年芝加哥公牛隊(Chicago Bulls)所創,7210敗的記錄。勇士這年還創下很多紀錄,包括成為NBA史上,第一支在單季例行賽裡,沒有連敗過的球隊,及第一支在單季例行賽裡,投進1,000顆以上三分球的球隊。光是控球後衛史蒂芬柯瑞(Stephen Curry1988-)一人,便投進402顆,也是NBA個人於單季例行賽中,投進最多三分球的紀錄。這樣超強的球隊除了查爾斯巴克利(Charles Barkley1963-),那位一向口無遮攔的電視籃球評論員外,恐怕無人不看好他們能連莊總冠軍。

季後賽首輪,勇士以41擊敗休士頓火箭隊(Houston Rockets)次輪再度以41終結波特蘭拓荒者隊(Portland Trail Blazers),順利打進西區冠軍賽對手是奧克拉荷馬市雷霆隊(Oklahoma City Thunder)。首戰雷霆隊贏了,第二戰勇士隊扳回一城,雙方11平手。接著兩戰,整年例行賽不曾連敗過的勇士隊,居然跌破眾人眼鏡,連敗兩場,讓雷霆隊取得31敗的聽牌優勢。數據會說話,例行賽輝煌的戰績被拋開了,媒體拿出過去的統計資料分析。勇士隊的衛冕之路,不要說被看成亮起紅燈、陷入困境,甚至有人認為已命懸一線了。球運豈能每年都那麼好?雷霆隊的支持者興奮莫名,勇士隊的支持者則覺怎麼可能輸成這樣至於查爾斯巴克利,該可以得意了。

NBA分區冠軍賽史上,之前共出現過3931的戰局。而領先的球隊,最終有37隊拿下分區冠軍。其中有20隊,是再賽1場,領先者就以41敗終結比賽了。僅有的兩次逆轉,都發生在東區,一次是1979年,一次是1981,都至少是25年前的事了。不妙的是,勇士隊所隸屬的西區,冠軍賽則未曾有過由13翻盤成功之例。39分之2,僅比5%略多一點的機會。而如果單看西區,則過去成功0次,因此機會是0處在13敗大幅落後的局面,多少反映雙方實力有差,若說大勢已去,算是持平之論,畢竟數據會說話。還有人宣稱勇士隊翻盤的機率,不到4%,他們有不同的依據。NBA自從將季後賽改為74勝制後,各輪都計,球隊陷入13敗的絕境者,總共有232次,其中只有9次扭轉奇蹟。232分之9,約0.03879。那一不到4%的值,就是這麼來的。

不論機率是0.050.04,或是0,大部分關心NBA球賽的人,都認為勇士隊不可能贏了。世事難料,不可能的事,又一次發生了勇士隊有如浴火重生,連贏3場,以43敗,獲得西區冠軍,取得與東區冠軍克里夫蘭騎士隊(Cleveland Cavaliers),角逐總冠軍的資格。成為NBA西區冠軍爭奪戰史上,第一支在13敗之劣勢下,逆轉的球隊也讓原本充滿希望的雷霆隊,黯然神傷地打包回府,結束球季。

有些較具機率背景的人,可能覺得前述求機率的過程,並不可取。我們常在談機率,機率究竟是什麼?眾所周知,機率有幾種不同的意義。第一種是所謂古典機率,即以相同的可能性來解釋機率。進行一項隨機試驗,以S表所有可能的結果之集合S稱為樣本空間,當然不可以是空集合,也不可以有無限多個元素。S的任一子集合,稱為一事件,S中的元素個數以|S|表之想求一事件A的機率,其元素個數以|A|表之。由於假設相同的可能性,故每一可能的結果,發生之機率皆相同,即為1/|S|因此A之機率,顯然便定義為P(A)=|A| / |S|。諸如玩撲克牌,及玩樂透彩等,都屬於古典機率適用的範圍。

重複投擲一銅板n次,得到k個正面,則將k/n視為銅板出現正面的機率。這種以事件發生次數的相對頻率,來解釋機率,是一常有的作法,稱為以頻率來解釋機率,又稱客觀機率,適用在可重複觀測的事件。所謂客觀,乃由於就是依觀測到的結果,沒有滲入個人的偏好。A君準備出門,其母抬頭望天,只見烏雲密佈,覺得下雨的機率有8成,力勸A君帶傘A君卻不以為然判斷烏雲應就快散去了,下雨的機率頂多1,雨傘大可不必。這便是主觀機率,也是一種常用來解釋機率的方式,一般針對無法重複觀測的事件。由於各人對於同一事件的機率值,能有不同的認定,因而稱之為主觀機率。不過雖說主觀,往往也會依據過去客觀的事實,不見得都僅憑主觀好惡,來決定機率值。

除了上述三種對機率的解釋,1933,公理化的方式誕生了,即以機率空間來解釋機率。也就是在一抽象的系統上,藉助幾條公理,引進機率。此後,便不必經由一投擲銅板或骰子等情境,才能討論機率。但若真有一隨機試驗,則必能在一適當的機率空間上,定義機率。

古典機率、客觀機率,及主觀機率,常交錯著使用。當沒有更多的資訊下,常只能採古典機率。如有人敲門,是男是女?若一無所知,只好認為是男是女的機率相同,即皆為1/2但若平日屢有訪客,而過去的經驗顯示,敲門者有7成是女性,則大抵便會認為男女的機率,各為0.30.7。另外,若聽到的敲門聲很大,有人說不定便以為,有0.8的機率是男生,因而女生的機率便為0.2

回到勇士隊對決雷霆隊,於13敗落居下風後,人們依據過去的資料,以預測勇士隊逆轉的機率。此為合理的統計思維。只是對於處在13敗落後的情況,雖有過去39次分區冠軍賽,及全部232次季後賽的數據,但年度不同、球隊不同、對手不同、裁判不同,即使同一球隊,不同年度的球員或教練,也可能不盡相同。故不論39232次,皆不屬重複觀測的事件。反對者因而認為,此處並不適用以頻率來解釋機率。這樣說當然極有道理,觀念正確。正如若每次投擲不同的銅板,則正面出現的相對頻率,豈能用來估計下一次投擲,會出現正面的機率?但與其認為,由於有逆轉及不逆轉兩種結果,因而逆轉的機率為1/2(即採古典機率),倒不妨採取客觀機率的想法。即基於過去數十年,類似情況的比賽結果,來判斷逆轉之機率。這比起胡亂猜測,畢竟仍客觀許多。

有趣的是,當第6雷霆隊輸球,與勇士隊打成33平手,這時不同的預測值出現了。過去季後賽的資料顯示,主場球隊的第7戰成績是10024敗;另一方面,第6戰主場落敗的球隊,第7戰的成績是1224。由於第6戰及7戰的主場,分別屬於雷霆隊及勇士隊,因此前述兩筆數據,便分別導致勇士隊奪得西區冠軍的機率,為100/12424/36。二值皆遠比處於13落後時,對勇士隊逆轉機率之預測,高出不少。怎會如此?沒什麼這不過就是條件機率。當情況改變時,機率值常隨之而變機率值會變,乃機率之一特色

不時會聽到人們抱怨豈有此理或訝異地說怎麼可能?顯然天下事,並非都盡合理。而被視為不可能的事,也屢屢就是發生了。崇尚合理性,棄不可能如敝屣,通常並沒有不對,但卻無法保證決策必然正確。連不合理,連不可能的事,都會發生,那判斷怎會永不失誤?投擲一銅板,除非兩面皆相同,否則豈會每次都說對那面朝上?在隨機世界中誤差就是難以避免。我們所能做的,就是以機率的方式,來掌握誤差的大小。

   暫無回應
 回本區首頁 
  回應總數0  
 
 
  下一頁  
  
 
我要回應
姓 名: 回應前,請先註冊登入
E-mail:
內 容:
驗證碼:  (0D0E
 
 
:::
 
*

地  址:811高雄市楠梓區高雄大學路700號
電  話:07-5919362 傳真:07-5919360 e-mail: stat@nuk.edu.tw
更新日期:2024/4/11 上午 09:16:10

2003/10/20起第 9023652 位訪客
*