國立高雄大學統計學研究所
最新消息 本所簡介 師資介紹 開設課程 教師成果 學生表現 學術演講 入學管道 學生園地 心在南方 表格下載 活動集錦 網路資源 關於我們
本站首頁 本校首頁 英文版
:::心在南方  
主題:談中位數
發表者:黃文璋 Email:huangwj@nuk.edu.tw 日期:2015/10/12 上午 09:56:06

某高中的一年級有十幾班,入學後第一次月考完,想評比各班某科的成績。各班的分數全攤開來,互有高低,看不出所以然。如何比呢?依各班該科平均成績來定優劣,為一常見的方法。人們常想以一個單一的值,來代表一組數據,平均數便是常被採用的。平均數有一些優點,如意義明確,及計算容易等。

以平均數來充當一組數據的代表值,並非永遠很恰當。職業球隊,球員的薪資,差異往往很大。每隊總會有一兩位超級好手,其薪資令人仰之彌高。但大部分的球員,薪資都不太高。這時平均薪資,常被少數天價球員大幅拉高。外界覺得打球待遇真好,不少球員卻只能苦笑。當數據中有很極端的值時,平均數便不見得是很適合的代表值了。這時中位數,常是代表值的另一選項。

中位數如何定義?九年一貫數學課綱裡說中位數是將資料排序後,前後各切一半的中間位置資料值。這樣定義,符合我們的直觀。但依此定義,在求中位數時,卻屢引起一些困惑。例如,有數據12345,中間位置為3,但如何前後各切一半?又如對於數據123456,前後各切一半,有一半是123,另一半是456,但中間位置是那一個?3.5嗎?中位數可以不必是數據中的某一數嗎?看來前述定義不算是很周詳。

另一種常見的的定義是,將所有數據由小排到大,若數據有奇數個,則正中間那個,就是中位數;若數據有偶數個,則取最中間那兩數之平均當做中位數。

再給一常見的中位數之定義,此定義所決定的中位數,為數據裡的某一個。若數據中在某值之前及之後,皆至少有50%個,則該值便為此組數據之中位數。注意這裡的之前及之後,都包含該值。本定義是依循百分位數的定義而來。我們來重新檢視前述2筆數據。對12345,顯然3為中位數,因在3之前及之後,各有3個數,皆佔60%,即皆至少有50%。其次對123456,因在3之前及之後,各有3個及4個數,分別佔1/22/3,皆至少有50%同理4亦為中位數。此筆數據有兩個中位數,有時為了簡便,取二數的平均3.5當做中位數。平均數有時與中位數很接近,甚至是同一值。如數據12345之平均數與中位數都是3。至於對1234500,平均數為102。那一特別大的數500,讓平均數增大不少,但中位數仍為3,並不受5變成500之影響。

有人可能覺得統計果真是麻煩。既然稱做中位數,不就該是位居中間,前後各半,簡單明瞭。如今居然說這樣的定義窒礙難行,提出不只一個修正版,其中一個改為前後都至少”各半,且還不必位居中間。只是修正的定義,看起來卻的確較合理。究竟是怎麼回事?曾有學者指出統計只適合處理大量數據,試圖以此消弭一些統計所可能引起的爭議。但這講法並不正確,因即使很少量的數據,求平均數,也毫無問題。因此統計絕非只適合處理大量數據。而有些民調被認為結果不可靠,關鍵也並不在於樣本數的多寡。

這樣說好了,數學要求明確,放諸四海而皆準。在數學課程裡,有爭議的中位數定義,於實務中,卻往往不算什麼問題。以美國棒球大聯盟(MLB)2015年球員的年薪來說,有報導說中位數是470萬美元。怎麼那麼粗糙,只給到十萬?因實際收入可能包含績效獎金等,說來有點複雜,且薪水涉及隱私,記者掌握的資料不見得都很可靠,由於原始數據便可能不精確,這時太在乎細節,就不是那麼必要,以免見樹不見林。因此是否真有一個中間位置,是否真能前後各切一半,何須太在意?只要是一差不多在中間的值,讓人對球員年薪落在那裡,能略有概念就可以了。

   暫無回應
 回本區首頁 
  回應總數0  
 
 
  下一頁  
  
 
我要回應
姓 名: 回應前,請先註冊登入
E-mail:
內 容:
驗證碼:  (XDK0
 
 
:::
 
*

地  址:811高雄市楠梓區高雄大學路700號
電  話:07-5919362 傳真:07-5919360 e-mail: stat@nuk.edu.tw
更新日期:2024/4/11 上午 09:16:10

2003/10/20起第 9047369 位訪客
*