next up previous
Next: 分位圖 Up: 敘述統計 Previous: 莖葉圖

盒鬚圖

盒鬚圖(又稱長鬚圖, box-and-whisker plot, 簡稱boxplot), 是一很有效的表示資料的方法, 很多計算機程式中皆有此功能。 盒鬚圖可用來了解資料的偏斜性(skewness)離群值(outliers)。圖6.3為一典型的盒鬚圖。


\begin{picture}(0,50)(-12,0)
\setlength{\unitlength}{1mm}\put(0,0){\line(1,0){95...
...e(0,1){10}}
\put(40,5){\line(0,1){10}}
\put(65,10){\line(1,0){20}}
\end{picture}
    

圖6.3 盒鬚圖
    


圖6.3中, $A$稱為資料的最小值, $E$稱為最大值, $B$$D$則分別為資料的下四分位數及上四分位數, 因此圖中盒子(盒子之高度並不重要)包含資料的中間$50\%$部分。 又$C$為資料的中位數。圖6.3包含一個盒子, 及二凸出來的鬚($\overline{AB}$$\overline{DE}$上方二線段), 這是此圖命名的由來。

樣本的中位數, 上四分位數及下四分位數, 以及一般的第$p$分位數, 皆可與分佈的分位數對應。設有數據 $y_1,\cdots,y_n$, 將其按小至大排列, 而得 $y_{(1)}\leq y_{(2)}\leq \cdots\leq
y_{(n)}$。關於樣本第 $\mbox{\mathversion{bold}{$p$}}$分位數(或說 $\mbox{\mathversion{bold}{$p$}}$樣本分位數), 不同的書有不同的定義。 有些書是定義為$y_{([np]+1)}$, 其中$[\cdot]$為最大整數函數。 此定義雖然簡單, 但缺點為若$p$$r$很接近, 則第$p$分位數與第$r$分位數可能會相等。另外, 亦可將樣本的第$p$分位數定義為

$\displaystyle \hspace*{0.26in}
y_{([(n+1)p])}+((n+1)p-[(n+1)p])(y_{([(n+1)p]+1)}-y_{([(n+1)p])})\raisebox{-1.2mm}{。}$     (1.1)

這其實是線性內插法的概念。我們以下例來說明。


例1.1 設有數據$8, 20, 5, 15$。求樣本之第$0.37$分位數。
解.先將樣本按小至大排列, 而得$y_{(1)}=5$, $y_{(2)}=8$, $y_{(3)}=15$, $y_{(4)}=20$。因$n=4$, $p=0.37$, $[np]+1=[4\cdot
0.37]+1=[1.48]+1=2$。 故以第一種定義所得之第$0.37$樣本分位數為$y_{(2)}=8$。 又若$p=0.4$, 則$[np]+1=2$, 故第0.4樣本分位數亦為$y_{(2)}=8$。 事實上從第0.25至第0.49樣本分位數皆為8。

現在來看第二種定義。四個樣本點, 將樣本的值域分成五個區間, 此四點便對應第0.2, 0.4, 0.6及0.8分位數。 第0.37分位數介於第0.2及0.4分位數間。而$y_{(1)}=5$, $y_{(2)}=8$, 因此第0.37樣本分位數為

\begin{eqnarray*}
5+\frac {0.37-0.20}{0.40-0.20}(8-5)=5+0.85\cdot 3=7.55\raisebox{-1.2mm}{。}
\end{eqnarray*}



    


第二種定義的優點是不同的$p$值, 有不同的第$p$分位數。 缺點是$p$不能很靠近0或1。此因若$p<1/(n+1)$, 則$[(n+1)p]=0$, 但我們並沒有$y_{(0)}$的定義。又當$p>n/(n+1)$, 則$[(n+1)p]+1>n$, 因此 $y_{([(n+1)p]+1)}$也不存在。

$p=1/2$, (6.1)式導致樣本中位數為

此與4.5節對樣本中位數所給的定義相符合。

底下我們對樣本第$p$分位數採第二種定義。 如此樣本的第$i/(n+1)$分位數, 即樣本的第$i$個順序統計量$y_{(i)}$(習題第4題)。


例1.2 瑞萊曾由不同的來源量測標準體積中氮(nitrogen)的重量(見Tukey
(1977)), 而得到下述數據:

\begin{eqnarray*}
&& 2.30143, \ 2.29816, \ 2.30182, \ 2.29890, \ 2.31017,\\
&& ...
... \ 2.29889, \ 2.31024, \ 2.31030, \ 2.31028\raisebox{-1.2mm}{。}
\end{eqnarray*}



將數據表至小數第3位(四捨五入), 則圖$6.4a$, $b$分別為點圖及盒鬚圖。
\begin{picture}(0,72)(-12,0)
\setlength{\unitlength}{1mm}\put(0,0){\line(1,0){45...
...e(1,0){33}}
\put(76,5){\line(0,1){10}}
\put(100,5){\line(0,1){10}}
\end{picture}
    



圖6.4 圖$a$及圖$b$分別為例6.2中之點圖及盒鬚圖
    




admnuk 2004-01-12