離差

名詞解析

名詞: 全距(range)
解釋:

一組資料中最大值與最小值之差。

名詞: 四分位數(quartile)
解釋: 一組 n 筆資料的第 k 四分位數,寫成 (k=1,2,3), 定義為至少有個資料小於或等於 ,也至少有 個資料大於或等於 。第二四分位數就是中位數,而第一四分位數又稱下四分位數,第三四分位數又稱上四分位數。

名詞: 四分位差(quartile deviation)
解釋:

第三四分位數與第一四分位數的差距稱為四分位差,簡寫成Q.D. ,即

名詞: 離差(deviation)
解釋:

設有 n 筆資料,其平均數為 ,則第 i 筆資料 的離差定義為

名詞: 樣本變異數(sample variance)
解釋:

設有 n 筆資料,其平均數為,則樣本變異數,定義為

與樣本變異數相似的, 為母體變異數,定義為

此二者差異在於樣本變異數是不偏的(unbiased), 母體變異數為偏差的(biased)。

如果估計量對所有可能的樣本之期望值等於被估計的值, 這個估計量就是『不偏』的, 否則就是『有偏』的。

一般而言, 若無特別聲明, 變異數通常指樣本變異數。

名詞: 樣本標準差(sample standard deviation)
解釋:

樣本標準差 S 為樣本變異數之開方,即

與樣本標準差類似的, 為母體標準差, 定義為母體變異數之開方,即

一般而言, 若無特別聲明, 標準差通常指樣本標準差。

 

生活中的實例

設有20位學生的數學成績由低至高排序如下(單位為分):

47, 50, 52, 53, 54, 56, 56, 60, 62, 62, 62, 65, 67, 69, 71, 73, 74, 79, 80, 82。

則全距為最高分與最低分之差,即

82-47=35(分)。

因 20 為偶數,所以中位數為排序後第10與第11個數之平均即62,而第一四分位數為排序後前10個之中位數,即第5個數與第6個數之平均,故

同理第三四分位數為排序後後10個之中位數,即第15個數與第16個數之平均,故

所以四分位差為

某一球隊,隊中15名球員的身高如下(單位為公分):

167, 166, 169, 171, 164, 167, 167, 173, 179, 170, 163, 168, 180, 175, 171。

我們將15名球員之身高由矮至高排列如下:

163, 164, 166, 167, 167, 167, 168, 169, 170, 171, 171, 173, 175, 179, 180。

因 15 為奇數,所以中位數為排序後第8個數即169。而第一四分位數為排序後前 7 個數之中位數,即第4個數,故=167(公分)。

同理第三四分位數為排序後後7個數之中位數,即第12個數,因此=173(公分)。

所以四分位差為

其次我們以列表方式來求樣本標準差。

167
166
169
171
164
167
167
173
179
170
163
168
180
175
171
小計
-3
-4
-1
1
-6
-3
-3
3
9
0
-7
-2
10
5
1
0
9
16
1
1
36
9
9
9
81
0
49
4
100
25
1
350

其中表此15名球員的平均身高,可算出=170公分,

樣本變異數為

因此樣本標準差為