第三章 随机向量3.1 随机向量的分布随机向量及其分布函数概念
- \(X_1,X_2,\cdots,X_n\)是\(n\)个随机向量,则\((X_1,X_2,\cdots,X_n)\)是一个\(n\)维随机向量。
- \(n\)元函数\(F(x_1,x_2,\cdots,x_n)=P\{X_1\le x_1,X_2\le x_2,\cdots,X_n\le x_n\}\)为随机向量\((X_1,X_2,\cdots,X_n)\)的分布函数。其中\(\{X_1\le x_1,X_2\le x_2,\cdots,X_n\le x_n\}\)表示\(\{X_1\le x_1\},\{X_2\le x_2\},\cdots,\{X_n\le x_n\}\)的交事件。
一般不会讨论高维的向量,教材上大多是二维向量。
概率表示
\[P\{x_1<X\le x_2,y_1<Y\le y_2\}=F(x_2,y_2)-F(x_2,y_1)-F(x_1,y_2)+F(x_1,y_1)\]性质
\(0\le F(x,y)\le1\).
\(F(x,y)\)关于\(x,y\)均单调、非降、右连续.
极限值:
- \(F(-\infty,y)=\lim\limits_{x\to-\infty}F(x,y)=0\)
- \(F(x,-\infty)=\lim\limits_{y\to-\infty}F(x,y)=0\)
- \(F(-\infty,-\infty)=\lim\limits_{(x,y)\to(-\infty,-\infty)}F(x,y)=0\)
- \(F(+\infty,+\infty)=\lim\limits_{(x,y)\to(+\infty,+\infty)}F(x,y)=1\)
(一维)边缘分布函数
\(F_X(x)=P\{X\le x\}=P\{X\le x,Y<+\infty\}=F(x,+\infty)\)
\(F_Y(y)=P\{Y\le y\}=F(+\infty,y)\)
一般地,对于\(n\)维随机向量的分布函数的边缘分布函数为:
\[F_i(x_i)=F(+\infty,\cdots,+\infty,x_i,+\infty,\cdots,+\infty),\quad i=1,2,\cdots,n\]
离散型随机向量的概率分布定义
如果二维随机向量\((X,Y)\)只取有限个或可列个值,则称\((X,Y)\)为二维离散型随机向量。
其概率分布为:
\[P\{X=x_i,Y=y_j\}=p_{ij},\quad i,j=1,2,\cdots,\]
也叫做\(X\)和\(Y\)的联合概率分布。
性质
- \(p_{ij}\ge0,\quad i,j=1,2,\cdots;\)
- \(\sum\limits_i\sum\limits_jp_{ij}=1\).
概念
联合概率分布表:以二维表格形式表示二维离散型随机向量的概率分布。
边缘概率分布:联合概率分布的某一行或某一列的和。
连续型随机向量的概率密度函数定义
二维随机向量\((X,Y)\)的分布函数为\(F(x,y)\),如果存在一个非负可积的二元函数\(f(x,y)\),使得对任意实向量\((x,y)\),有
\[F(x,y)=\int_{-\infty}^x\int_{-\infty}^yf(s,t)\mathrm{d}s\mathrm{d}t,\]
则称\((X,Y)\)为二维连续型随机向量,并称\(f(x,y)\)为\((X,Y)\)的概率密度函数,或\(X\)和\(Y\)的联合密度函数。
性质
\(f(x,y)\ge0\)
\(\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}f(x,y)\mathrm{d}x\mathrm{d}y=1\)
若\(D\)是平面上的一个区域,则\(P\{(X,Y)\in D\}=\iint\limits_Df(x,y)\mathrm{d}x\mathrm{d}y\)
边缘分布函数
\[\begin{align*}F_X(x)&= P\{X\le x\}=P\{X\le x,Y\le+\infty\}\\&= \int_{-\infty}^x\int_{-\infty}^{+\infty}f(s,t)\mathrm{d}s\mathrm{d}t \\&= \int_{-\infty}^x \left[ \int_{-\infty}^{+\infty}f(s,t)\mathrm{d}t \right] \mathrm{d}s.\end{align*}\]
边缘密度函数
\[f_X(x)=\int_{-\infty}^{+\infty}f(x,y)\mathrm{d}y \\f_Y(y)=\int_{-\infty}^{+\infty}f(x,y)\mathrm{d}x \\\]
均匀分布
如果一个二维随机向量\((X,Y)\)以
\[f(x,y)=\left\{\begin{align*}& \frac{1}{S(G)},\quad\quad(x,y)\in G,\\& 0,\quad\quad\quad\quad 其他,\end{align*}\right.\]
为密度函数,则称\((X,Y)\)服从区域\(G\)上的均匀分布。
图像
平面区域上的均匀分布实质就是平面区域上的几何概型。
二元正态分布定义
设随机向量\((X,Y)\)的密度函数为
\[\varphi(x,y)=\frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}e^{-\frac{1}{2(1-\rho^2)}\left[ \frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}\right]},\]
其中\(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho\)均为参数,且\(\sigma_1>0,\sigma_2>0,|\rho|<1\),则称\((X,Y)\)服从参数为\((\mu_1,\mu_2;\sigma_1^2,\sigma_2^2;\rho)\)的二元正态分布,记作\((X,Y)\sim N(\mu_1,\mu_2;\sigma_1^2,\sigma_2^2;\rho)\).
性质
二元正态分布以\((\mu_1,\mu_2)\)为中心,中心附近具有较高密度,离中心越远,密度越小。
边缘密度函数
- \(\varphi_X(x)=\frac{1}{\sqrt{2\pi}\sigma_1}e^{-\frac{(x-\mu_1)^2}{2\sigma_1^2}}\)
- \(\varphi_Y(y)=\frac{1}{\sqrt{2\pi}\sigma_2}e^{-\frac{(x-\mu_2)^2}{2\sigma_2^2}}\)
- \(X\sim N(\mu_1,\sigma_1^2),\ Y\sim N(\mu_2,\sigma_2^2)\)
参数\(\rho\)是随机变量\(X,Y\)的相关系数,\(\rho=0\)表示\(X,Y\)相互独立,此时对于任何\((x,y)\),有
\[\varphi(x,y)=\varphi_X(x)\varphi_Y(y)\]
注:
- 二元正态分布的边缘分布只有前4个参数确定,因此对于只有参数\(\rho\)不同的二元正态分布,它们的边缘分布是一致的。
- 只有\(X\)和\(Y\)的边缘分布不能唯一确定二元正态分布,还需要明确的参数\(\rho\).
- 两个边缘分布为正态分布的二位随机向量不一定服从二元正态分布。
使用教材:
《概率论与数理统计》第四版 中国人民大学 龙永红 主编 高等教育出版社