第 3 章 多元随机变量及其分布
约 732 个字 3 张图片 预计阅读时间 7 分钟
二维离散型随机变量
联合分布律(Joint Mass Function)
- \(P(X=x_i,Y=y_j)=p_{ij}\;\;i,j=1,2,...\);
亦可使用列表来表示:

边际分布律(Marginal Mass Function)
边界分布律即联合分布律的行 / 列求和
- \(P(X=x_i)=P(X=x_1,\bigcup_{j=1}^{\infty}(Y=y_j))=\sum_{j=1}^{\infty}p_{ij}:=p_{i·}\);
- \(P(Y=y_j)=P(\bigcup_{i=1}^{\infty}(X=x_i),Y=y_j)=\sum_{i=1}^{\infty}p_{ij}:=p_{·j}\);

条件分布律(Conditional Mass Function)
- \(P\{X=x_i|Y=y_j\}=\frac{P(X=x_i,Y=y_j)}{P(Y=y_j)}=\frac{p_{ij}}{p_{·j}}\;\;i,j=1,2,...\);
- \(P\{X<x|Y<y\}=\frac{P\{X<x,Y<y\}}{P\{Y<y\}}\) 然后根据联合分布律和边际分布律读表计算;
分布函数
- 联合分布函数 \(F(x,y) = P(X \leq x, Y \leq y)\) 是二元函数
- 边际分布函数 \(F_X(x) = P(X \leq x) = lim_{y \rightarrow + \infty}F(x,y)\) 是关于 \(x\) 的一元函数
- 条件分布函数 \(F_{X \mid Y}(x \mid y) = P(X \leq x \mid Y=y)\) 是关于 \(x\) 的一元函数
- \(\lim_{\epsilon \rightarrow 0^+}P(X\leq x\mid y<Y\leq y+\epsilon)\) 也记为 \(P(X \leq x \mid Y=y)\),请特别注意这个记号所带来的两种理解
联合分布函数
\(F(x,y)=P\{X\leq x,Y\leq y\}\) 为 \((X,Y)\) 的联合概率分布函数,简称联合分布函数(Joint Distribution Function),其具有如下性质:
- 固定其中一个变量,则该二元函数关于另外一个变量单调不减;
-
\(0\leq F(x,y)\leq 1\),且 \(F(x,-\infty)=F(-\infty,y)=F(-\infty,-\infty)=0\;,\;F(+\infty,+\infty)=1\);
-
\(F(x,y)\) 关于 \(x\) 和 \(y\)分别右连续(离散
) ; -
\(x_1<x_2\;,\;y_1<y_2\) 时,有:\(P\{x_1<X\leq x_2\;,\;y_1<Y\leq y_2\}=F(x_2,y_2)-F(x_1,y_2)-F(x_2,y_1)+F(x_1,y_1)\geq0\) 这可以由几何意义简单推出。

边际分布函数
\(X\) 关于联合分布函数 \(F(x,y)\) 的边际分布函数定义为:
- 对 \(y\) 来说同理
条件分布函数
\(X=x_i\) 条件下 \(Y\) 的条件概率分布函数为:
二维连续型随机变量
联合分布
设二元随机变量 \((X,Y)\) 的联合分布函数为 \(F(x,y)\),若存在二元函数 \(f(x,y)\geq0\),则对于任意的实数 \(x\),\(y\) 有
则称 \((X,Y)\) 为二元连续型随机变量(Bivariate Continuous Random Variable),称 \(f(x,y)\) 为 \((X,Y)\) 的联合概率密度函数(Joint Probability Density Function),简称为联合密度函数。 其具有以下性质:
- \(f(x,y)\geq 0\);
- \(F(x,y)=\int_{-\infty}^x\int_{-\infty}^yf(u,v)\mathrm{d}u\mathrm{d}v=F(+\infty,+\infty)=1\);
- 在 \(f(x,y)\) 的连续点上有 \(\frac{ \partial^2F(x,y) }{ \partial x\partial y }=f(x,y)\);
- \((X,Y)\) 落入 \(xOy\) 平面任意区域 \(D\) 的概率为:\(P\{(X,Y)\in D\}=\iint \limits_{D} f(x,y)\mathrm{d}x\mathrm{d}y\);
- 由于其几何意义为落在以 \(D\) 为底,以曲面 \(z=f(x,y)\) 为顶面的立体体积,所以当 \(D\) 面积为 \(0\) 时概率为 \(0\):
eg:\(P(X=1,Y=1)=0\),\(P(X+Y=1)=0\),\(P(X^2+Y^2=1)=0\);
边际分布
二位连续型随机变量 \((X,Y)\) 中单个随机变量 \(X\) 的密度函数为 \(X\) 的边际概率密度函数(Marginal Probability Density Function),简称边际密度函数。由于
所以:
同理:
条件分布
设 \((X,Y)\) 为二元连续型随机变量,对给定的 \(x\),若 \(P\{x<X\leq x+\delta\}>0\),则称对任意的 \(y\) 有:
为 \(Y\) 在 \(X=x\) 的条件下的条件分布函数。
一般地
设 \((X,Y)\) 为二元随机变量,对给定的 \(x\),若极限:
$$\lim\limits_{\delta\rightarrow 0^+} P {Y\leq y|x-\delta<X\leq x+\delta }=\lim\limits_{\delta\rightarrow 0^+}P{Y\leq y|x-\delta<X\leq x+\delta} $$
对任意的 \(y\) 都存在,则称 \(Y\) 在 \(X=x\) 的条件下服从条件分布函数
由于对二维连续性随机变量 \((X,Y)\) 有:
且
所以:
我们由此可给出二维连续型随机变量的条件概率密度函数:
二元均匀分布和二元正态分布
均匀分布
如果二元随机变量 \((X,Y)\) 在二维有界区间 \(D\) 上取值,且具有联合密度函数
则称 \((X,Y)\) 服从 \(D\) 上的均匀分布。
得到:\(P\{(X,Y)\in D_1\}=\frac{D_1\text{的面积}}{D\text{的面积}}\;,\;\;\text{且}D_1\subset D\)。
正态分布
如果二元随机变量 \((X,Y)\) 具有联合密度函数
,且有 \(|\mu_1|<+\infty,|\mu_2|<+\infty,\sigma_1>0,\sigma_2>0,|\rho|<1\)
则称 \((X,Y)\) 服从参数为 \((\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)\) 的二元正态分布(Bivariate Normal Distribution),记做 \((X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)\)。
- 二维正态分布的两个边际分布都是对应参数的一维正态分布,与 \(\rho\) 无关。
二维正态分布的两个边际分布
二维正态分布的两个条件分布
随机变量的独立性
如果对于任意的两个实数集合 \(D_1,D_2\),有
则称随机变量 \(X,Y\)相互独立,即 \(X,Y\)独立。
也可以说:当 \(P\{X\leq x,Y\leq y\}=P\{X\leq x\}·P\{Y\leq y\}\),即 \(F(x,y)=F_x(x)·F_y(y)\) 时,\(X,Y\) 独立。
- 若 \((X,Y)\) 是离散型随机变量,则 \(X,Y\) 相互独立等价于 \(p_{ij} = p_{i\cdot}p_{\cdot j}\) 对一切 \(i,j\) 都成立
- 若 \((X,Y)\) 是连续型随机变量,则 \(X,Y\) 相互独立等价于 \(f(x,y) = f_X(x)f_Y(y)\) 总是成立,平面上“面积”为零的集合除外(可以在不连续点上不相等)
- 对于二维正态随机变量 \((X,Y)\),\(X\) 与 \(Y\) 相互独立的充要条件是参数 \(\rho = 0\).
\(n\) 维随机变量独立性相关定理:
- 设 \((X_1,X_2,\cdots ,X_m)\) 与 \((Y_1,Y_2,\cdots ,Y_n)\) 相互独立,则 \(X_i(i=1,2,\cdots ,m)\) 与 \(Y_j(j=1,2,\cdots ,n)\) 相互独立
- 设 \((X_1,X_2,\cdots ,X_m)\) 与 \((Y_1,Y_2,\cdots ,Y_n)\) 相互独立,若 \(h(x_1,x_2,\cdots ,x_m)\) 与 \(g(y_1,y_2,\cdots ,y_n)\) 是连续函数,则 \(h(X_1,X_2,\cdots ,X_m)\) 与 \(g(Y_1,Y_2,\cdots ,Y_n)\) 相互独立
多元随机变量函数的分布
卷积公式
这里讨论连续型,离散型只需把积分符号换成求和符号即可,当 \(X\) 和 \(Y\) 相互独立时,\(Z=X+Y\) 的条件下:
-
\[\begin{aligned} F_Z(z) &= \iint \limits_{x+y\leq z}f(x,y)\mathrm{d}x\mathrm{d}y\\ &=\int_{-\infty}^{+\infty}[\int_{-\infty}^{z-x}f(x,y)\mathrm{d}y]\mathrm{d}x \quad u=x+y\\ &= \int_{-\infty}^{+\infty}[\int_{-\infty}^{z}f(x,u-x)\mathrm{d}u]\mathrm{d}x\\ &=\int_{-\infty}^{z}[\int_{-\infty}^{+\infty}f(x,u-x)\mathrm{d}x]\mathrm{d}u\\ &=\int_{-\infty}^{z}f_Z(u)\mathrm{d}y \end{aligned}\]
-
其密度函数公式:
- \(f_Z(z)=\int_{-\infty}^{+\infty}f(z-y,y)\mathrm{d}y=\int_{-\infty} ^ {+\infty}f(x,z-x)\mathrm{d}x\)(\(x\),\(y\) 是对称的)
- 当 \(X\) 和 \(Y\) 相互独立时,\(Z\) 的密度函数公式也称为卷积公式:\(f_X*f_Y=\int_{-\infty}^{+\infty}f_X(z-y)f_Y(y)\mathrm{d}y=\int_{-\infty} ^ {+\infty}f_X(x)f_Y(z-x)\mathrm{d}x\)
常见分布的卷积
分布的卷积问题,也即是分布的可加性问题。
1. 二项分布的可加性:设 \(X\sim B(n,p)\),\(Y\sim B(m,p)\),\(0<p<1\),\(m\),\(n\) 均为正整数,若 \(X\) 与 \(Y\) 独立,则
二项分布的可加性有助于理解二项分布与两点分布的可加性。
2. 泊松分布的可加性:设 \(X\sim P({\lambda}_1)\),\(Y\sim P({\lambda}_2)\),\({\lambda}_i>0\),\(i=1,2\),若 \(X\) 与 \(Y\) 独立,则
3. 正态分布的卷积:设 \(X\sim N({\mu}_1,{\sigma}_1^2)\),\(Y\sim N({\mu}_2,{\sigma}_2^2)\),\(-\infty <{\mu}_i<+\infty\),\({\sigma}_i>0\),\(i=1,2\),若 \(X\) 与 \(Y\) 独立,则
4.\(\Gamma\) 分布的可加性:设 \(X\sim \Gamma ({\alpha}_1,\beta)\),\(Y\sim \Gamma ({\alpha}_2,\beta)\),\({\alpha}_i>0\),\(i=1,2\),\(\beta >0\) 均为正整数,若 \(X\) 与 \(Y\) 独立,则
指数分布是特殊的 \(\Gamma\) 分布,\(E(\lambda)=\Gamma (1,\lambda)\)。
5. 均匀分布的卷积:设 \(X\sim U(a_1,b_1)\),\(Y\sim U(a_2,b_2)\),若 \(X\) 与 \(Y\) 独立,则
M=max(X, Y), N=min(X, Y) 的分布
假设 \( X \) 和 \( Y \) 是两个独立的随机变量,它们的分布函数分别为 \( F_X(t) \) 和 \( F_Y(t) \)。我们定义:
- 最大值:\( M = \max(X, Y) \)
- 最小值:\( N = \min(X, Y) \)
最大值 \( M = \max(X, Y) \) 的分布
为了求出 \( M \) 的分布函数 \( F_{max}(t) \),我们需要计算:
这意味着我们要求 \( X \leq t \) 且 \( Y \leq t \),因此:
特别地,当 \( X \) 和 \( Y \) 相互独立时:
因此,最大值 \( M = \max(X, Y) \) 的分布函数为:
最小值 \( N = \min(X, Y) \) 的分布
为了求出 \( N \) 的分布函数 \( F_{min}(t) \),我们需要计算:
其中 \( P(N > t) \) 表示 \( X > t \) 且 \( Y > t \) 的概率,因此:
特别地,当 \( X \) 和 \( Y \) 相互独立时:
因此,最小值 \( N = \min(X, Y) \) 的分布函数为:
以上结果容易推广到 \(n\) 个变量的情形 , 特别地 , 设 \(X1 , X2, ... , X_n\) 为 \(n\) 个相互独立的随机变量 , 相应的分布函数分别为 F_1(x), F_2(x),... ,Fn(x) , 记 \(M = Max\{X_1 , X_2 , ... , X_n\}\) , \(N = min\{X_1 , X_2 , ... , X_n\}\) , 则