上一節目錄下一節

變 數 代 換  

             

        對一隨機變數$X$, 有時我們會想知道它的一個函數$Y=g(X)$的行為。$Y$便稱為$X$變數代換(change of variable)$Y$仍為一隨機變數。通常$X$的分佈知道, 而因$Y$的值是由$X$的值所決定, 故$Y$的分佈, 可由所給之$X$的分佈來決定。

       對每一實數的子集合$A$,

$\displaystyle P(Y\in A)=P(g(X)\in A)=P(X\in g^{-1}(A))\raisebox{-1.2mm}{.}$

(5.1)

在此

\begin{eqnarray*}
g^{-1}(A)=\{x\vert x\in R, g(x)\in A\}\raisebox{-1.2mm}{.}
\end{eqnarray*}

對於新的隨機變數$Y$, 由(5.1)式, 欲求$Y$落在某一集合$A$之機率, 仍要回到關於$X$的機率。

     
例 1.$X$為一離散型的隨機變數, 且p.d.f.為

$Y=X^2$, $Z=(X-2)^2$。求$Y$$Z$之分佈為何?  提示

 


例 2. 設隨機變數$X$之p.d.f.為

\begin{eqnarray*}
f(x)=\frac {1}{31} 2^{4-x}, x=0,1,2,3,4\raisebox{-1.2mm}{.}
\end{eqnarray*}

$Y=X^2+1$,$Z=g(X)=X^3-3X^2+X+2$。求$Y$$Z$之分佈為何?   提示


例 3. 設隨機變數$X$$\mathcal{U}$(0,1)分佈。即其p.d.f.為


分佈函數為

\begin{eqnarray*}
F(x)=\left\{
\begin{array}{ll}
0 & , x< 0, \cr x & , 0\leq x<1, \cr 1 & , x\geq 1\raisebox{-1.2mm}{.}
\end{array}\right.
\end{eqnarray*}

$Y=-\lambda^{-1}\log (1-X)$, 其中$\lambda>0$為一常數。$Y$之機率密度函數為何?  提示


例 4. 設隨機變數$X$之p.d.f.為

\begin{eqnarray*}
f_X(x)=\frac {2}{\pi(1+x^2)}, x>0\raisebox{-1.2mm}{.}
\end{eqnarray*}

$Y=1/X$。則此為一由$X$$Y$$1-1$變換, 且$Y$取值在$(0,\infty)$。我們想決定$Y$之p.d.f.。  提示


  定理 1. 設隨機變數$X$之分佈函數為$F_X$, 機率密度函數為$f_X$。令$Y=g(X)$, $Y$之分佈函數以$F_Y$表之。又令

$\displaystyle \Omega_1=\{ x\vert f_X(x)>0 \},$

(5.3)

(5.4)

(i) 若$g$$\Omega_1$為嚴格漸增函數, 則 $F_Y(y)=F_X(g^{-1}(y))$, $\forall y\in \Omega_2$;        證明

(ii) 若$g$$\Omega_1$為嚴格漸減函數, 則 $F_Y(y)=1-F_X(g^{-1}(y)-)$, $\forall y\in \Omega_2$

       $\Omega_1$$X$之機率密度函數取正值處。這種集合稱為分佈之支撐(support)。另外對一函數$F$,

\begin{eqnarray*}
F(x-)=\lim_{t\uparrow x}F(t),
\end{eqnarray*}

$F$$x$左極限值。同理可定義右極限$F(x+)$。只是若$F$為分佈函數, 因其為右連續, 故$F(x+)=F(x)$, $\forall x\in
R$

       定理 1適用連續及離離散型的隨機變數。當$Y$之機率密度函數為連續, 則利用定理 1, 可由微分分佈函數而得。

 

  定理 2.設隨機變數$X$之p.d.f.為$f_X$。令$Y=g(X)$, 其中$g$為一嚴格單調函數, $\Omega_1$$\Omega_2$分別定義在(5.3)及(5.4)式中。設$f_X$$\Omega_1$連續, 且$g^{-1}$$\Omega_2$有一連續的導數, 則$Y$之p.d.f.為

$\displaystyle f_Y(y)=f_X(g^{-1}(y))\left\vert\frac {d}{dy}g^{-1}(y)\right\vert, y\in
\Omega_2,$

(5.5)

$f_Y(y)=0$, $y\not\in \Omega_2$



例 5.$X$ $\mathcal{E}(\lambda)$分佈。令$Y=\sqrt{X}$。則 $\Omega_1=\Omega_2=(0,\infty)$, 且$X$之p.d.f. $f_X(x)=\lambda
e^{-\lambda x}$, $x>0$, 在$\Omega_1$中連續; $g^{-1}(y)=y^2$$\Omega_2$之導數$2y$為連續。故$Y$之p.d.f.為

\begin{eqnarray*}
f_Y(y)=f(y^2)\cdot 2y=2\lambda y e^{-\lambda y^2}, y>0\raisebox{-1.2mm}{.}
\end{eqnarray*}

$Y$稱為具有參數$\lambda$瑞萊分佈(Rayleigh distribution)。

 

例 6. 設隨機變數$X$ $\mathcal{U}(0,1)$分佈.令$Y=X/(1-X)$。試決定$Y$之p.d.f.及分佈函數。  提示

       

        在做變數代換時, 函數$g$有時不為嚴格單調, 因此定理 2就不適用。 但往往會有$g$在一個個的集合中, 分別為嚴格單調, 因此在每一個集合中, 皆可解出$X=g^{-1}(Y)$, 則仍有辦法求出$Y$之分佈。


例 7.$X$為一連續型的隨機變數, 令$Y=X^2$。則對$\forall y>0$, $Y$之分佈函數為

\begin{eqnarray*}
F_Y(y) &=& P(Y\leq y)=P(X^2\leq y)\\
&=& P(-\sqrt{y}\leq X\le...
...sqrt{y})-P(X\leq -\sqrt{y})\\
&=& F_X(\sqrt{y})-F_X(-\sqrt{y}),
\end{eqnarray*}


此處用到$X$為連續型, 所以 $P(X<-\sqrt{y})=P(X\leq -\sqrt{y})$

        現若$X$之p.d.f.存在, 則

\begin{eqnarray*}
f_Y(y) &=& \frac {d}{dy}F_Y(y)=\frac
{d}{dy}(F_X(\sqrt{y})-F_...
...sqrt{y})+\frac
{1}{2\sqrt{y}}f_X(-\sqrt{y})\raisebox{-1.2mm}{.}
\end{eqnarray*}

 

我們發現$Y$之p.d.f.為兩項之和, 分別對應區間$[0,\infty)$$(-\infty,0)$$y=g(x)=x^2$在前者有反函數$x=\sqrt{y}$, 在後者有反函數$x=-\sqrt{y}$

        定理  1推廣如下: 

        假設$\Omega_1$可寫成有限個不相交集合之聯集, 譬如說 $D_0,D_1,D_2,\cdots,D_k$, 其中$P(X\in D_0)=0$, $D_0$可能是一空集合, 使得$y=g(x)$在由每一$D_i$$\Omega_2$
皆為$1-1$之對應, $i=1,2,\cdots,k$。則 $\forall y\in \Omega_2$, 在$D_i$中恰有一$x_i$$y$對應, $i=1,2,\cdots,k$。因此即有$k$個反函數 $g_1^{-1}(y),\cdots,g_k^{-1}(y)$。又設$g_i^{-1}(y)$$\Omega_2$有一連續的導數。則$Y$之p.d.f.為     

$\displaystyle f_Y(y)=\sum_{i=1}^{k} f_X(g_i^{-1}(y))\left\vert\frac
{d}{dy}g_i^{-1}(y)\right\vert, y\in \Omega_2,$

(5.7)

$f_Y(y)=0$, $y\not\in \Omega_2$

        

對一分佈函數, 我們定義其分位函數(quantile function, 有時也稱反函數(inverse function), 但與一般反函數的定義不同)如下:

\begin{eqnarray*}
F^{-1}(x)=\inf \{ t\vert t\in R\mbox{且}F(t)\geq x\}, x\in (0,1)\raisebox{-1.2mm}{.}
\end{eqnarray*}

若一隨機變數$X$$F$為分佈函數, 則$F^{-1}$可同時稱為$X$$F$之分位函數。即使$F$不一定是連續, 也不一定嚴格漸增, $F^{-1}$必定存在。但若$F$為連續, 且嚴格漸增, 則$F^{-1}(x)$等於滿足$F(t)=x$之唯一的$t$。此時$F^{-1}$與一般反函數的意義相同。

        對 $\forall p\in (0,1)$, 令$x_p=F^{-1}(p)$。 則$x_p$稱為此分佈之 $\mbox{\mathversion{bold}{$p$}}$分位數($p$th-quantile), 或 ${\bf 100}\mbox{\mathversion{bold}{$p$}}$百分位數($100p$th-percentile)。 特別地$x_{0.25}$稱為下四分位數(lower quartile), $x_{0.75}$稱為上四分位數(upper quartile)。先給$F^{-1}$的一些基本性質。

 

  定理 3.$F^{-1}$為分佈函數$F$之分位函數。

(i) 對 $\forall x, t\in R$, $F^{-1}(x)\leq t$, 若且唯若$x\leq
F(t)$;

(ii) $F^{-1}$為非漸減且左連續的函數;

(iii) 若$F$為連續函數, 則 $F(F^{-1}(x))=x$, $\forall x\in (0,1)$


        
例 8. 設隨機變數$X$ $\mathcal{E}(1)$分佈。則$F(x)=1-e^{-x}$, $x>0$。由於在$x>0$處, $F$為嚴格漸增, 故$F^{-1}$$F$之反函數。經由解 $F(t)=1-e^{-t}=x$, 得 $F^{-1}$之圖形給在圖5.1。 注意 $\lim_{x\rightarrow 1-} F^{-1}(x)=\infty$

     

圖5.1 $F^{-1}(x)=-\log (1-x)$之圖形

    

例 9. 設有分佈函數

則在$x\in (0,0.5]$, 解$F(t)=0.5t=x$, 得 $t=F^{-1}(x)=2x$; 在 $x\in
(0.5,0.6]$, $t=F^{-1}(x)=2$; 在$x\in (0.6,1]$, 解 $F(t)=0.2t+0.2=x$, 得 $t=F^{-1}(x)=5x-1$。分位函數通常不定義在$x=0$$x=1$, 不過在本例中, $F^{-1}(1)=4$有定義。$F$之0.3分位數為0.6, 0.5分位數為1, 0.55分位數為2, 0.6分位數亦為2。$F(t)$$t=1.5$連續, 但     

\begin{eqnarray*}
F^{-1}(F(1.5))=F^{-1}(0.5)=1\neq 1.5\raisebox{-1.2mm}{.}
\end{eqnarray*}

$F^{-1}(x)$$x=0.55$連續, 但

\begin{eqnarray*}
F(F^{-1}(0.55))=F(2)=0.6\neq 0.55\raisebox{-1.2mm}{.}
\end{eqnarray*}

$F$$F^{-1}$之圖形如圖5.2.

\begin{picture}(0,90)(0,20)\thicklines\put(-10,0){\vector(1,0){140}} %x
\put(135...
....2mm}{.}}
\put(252,40){\line(1,0){8}}
\put(260,40){\line(1,1){40}}
\end{picture}



圖 5.2 例  9中$F$$F^{-1}$之圖形

       

       給一分佈函數$F$, 利用其分位函數$F^{-1}$及一有 $\mathcal{U}(0,1)$分佈的隨機變數, 可得一以$F$為分佈函數之隨機變數, 此過程即所謂分位轉換(quantile transformation)

 

  定理 4.$F$為一分佈函數, 且隨機變數$U$ $\mathcal{U}(0,1)$分佈。 則$X=F^{-1}(U)$
$F$為分佈函數。                                                                        證明


     當$F$為連續時, 定理 4有下述逆定理。

  定理 5.設隨機變數$X$之分佈函數$F$為連續, 則$Y=F(X)$ $\mathcal{U}(0,1)$分佈。                                                                                              證明


例 10. 設隨機變數$X$之分佈函數為$F(x)=x^3$, $0<x<1$。令$Y=F(X)=X^3$。驗證$Y$ $\mathcal{U}(0,1)$分佈。  提示

 


例 11. 設隨機變數$X$有標準的羅吉斯分佈, 即分佈函數

\begin{eqnarray*}
F(x)=\frac {1}{1+e^{-x}}, x\in R\raisebox{-1.2mm}{.}
\end{eqnarray*}

驗證$Y=F(X)$ $\mathcal{U}(0,1)$分佈。  提示

 

  進一步閱讀資料:黃文璋 (2003) . 基本概念數理統計講義第一章。國立高雄大學應用數學系。

上一節目錄下一節