國立高雄大學統計學研究所
最新消息 本所簡介 師資介紹 開設課程 教師成果 學生表現 學術演講 入學管道 學生園地 心在南方 表格下載 活動集錦 網路資源 關於我們
本站首頁 本校首頁 英文版
:::心在南方  
主題:差距多少才有效?
發表者:黃文璋 Email:huangwj@nuk.edu.tw 日期:2015/1/23 上午 11:32:30

激烈的選舉投票結束後,便是令人緊張的開票時刻。候選人自行計票,卻往往與選務單位公佈的得票數略有差異。可能是因廢票認定的標準不同,甚至計票時各種疏失就是難免。為讓那些最高票落選者心服,有些機構遂規定,若因得票率(得票數除以有效票數)差距未超過千分之3而落選者,得聲請重新計票。換句話說,千分之3的差距被認為夠小了,值得為此大費周章,將開票過程重走一遍。

究竟怎樣的差距算小?你知道當然不能用票數之絕對差來表示,因如果有效票數才1,000,則相差100票便很多,而有效票數若達1,000,000,則100票,便不算多。故有人遂藉得票率,即以相對差來表示差異大小,這是前述千分之3差距產生的背景。但以一固定的比率,來表示差距大小之門檻,其實也不盡然那麼合理。以男子100公尺短跑為例。目前的世界紀錄為9.58秒,是2009年創下的,而1968年的世界紀錄為9.95秒,每10年平均進步約0.09秒。因此若某次比賽,有選手將紀錄推進至9.48秒,雖只快了0.1秒,才約1%,想必會被認為是一大幅的進步,因發生的機率極低。又人的體能畢竟有其極限,總有一日若將紀錄推進0.05秒,即約0.5%,便會被大書特書了。

因此以發生機率之大小,來反映差距大小,在不少情況下,為一較合理的指標。我們藉投擲一公正銅板n次來說明不妨就假設n為偶數。你會預期必得到正反面數各半嗎?應該不會,因即使n=2,得到11反的機率為1/2,且有1/4的機率各得到2正及2反。那n愈大,會愈容易得正反面數各半嗎?仍不會,以n=10為例,利用排列組合,可求出得到55反的機率為252/1,024,小於1/4甚至可以證明,隨著n的增大,愈來愈不容易得正反面數各半,這點可能違反一般人的認知。底下以Sn表投擲n次後所得之正面數。對公正銅板,Sn=n/2。所以平均來說,正反面數會出現各半。但對隨機現象,Sn難免有偏差,通常不會剛好是n/2。偏差有多大?Sn的標準差為n1/2/2,此值隨著n之增大而增大。即n愈大時,Sn散佈的範圍將愈大,此範圍以n1/2/2的“速度”成長。但相對偏差,即偏差比上投擲數n,則愈來愈小。換句話說,所得正面數的比率Sn/n,其期望值為1/2,至於標準差,成為1/(2n1/2),隨著n之增大而減小。即當n愈大,正面出現率Sn/n散佈在1/2附近的範圍有愈來愈小的趨勢。因此Sn/n要偏離1/2一固定距離的機率將愈來愈小,這就是大數法則。大數法則針對的是正面出現率Sn/n而非正面數Sn,這是很多人常未能弄清楚的。

舉例來說明。設n=10,000,則Sn之期望值為5,000,標準差為50,千分之3的差距30,相當於0.6個標準差。即投擲一銅板10,000次,若得到正面數5,030,正面出現率比期望值僅超出0.6個標準差,其機率約為0.2709。這機率不算小,發生容易,所以很難據此推斷銅板非公正。而當n=1,000,000Sn之期望值為500,000,標準差為500,千分之3的差距3,000,相當於6個標準差。即投擲一銅板1,000,000次,若得到正面數503,000,正面出現率超出6個標準差。一般觀測值比期望值超出3個標準差就已很稀奇了,超出6個標準差,其發生的機率,至少到小數第8位都是0。機率這麼小的事件居然發生,當然會令人強懷疑銅板的公正性,即採信出現正面的機率>1/2

由以上討論知,得票率差距究竟大或小,乃與有效票數的多寡有關。有效票數若夠多,則千分之3的差距便已很大,用統計術語來說差距很顯著,這時落敗的一方,便不該心有不甘。讀者現在想必亦可了解,做統計分析時,何以會在意樣本大小,因取樣愈多偏差將愈小。

   暫無回應
 回本區首頁 
  回應總數0  
 
 
  下一頁  
  
 
我要回應
姓 名: 回應前,請先註冊登入
E-mail:
內 容:
驗證碼:  (8VX3
 
 
:::
 
*

地  址:811高雄市楠梓區高雄大學路700號
電  話:07-5919362 傳真:07-5919360 e-mail: stat@nuk.edu.tw
更新日期:2024/4/11 上午 09:16:10

2003/10/20起第 9007103 位訪客
*