条件分布

3.2.2 离散情形

对于离散型随机变量,可直接用条件概率计算。

定义3.5(X,Y)(X, Y) 的联合分布列为 P(X=xi,Y=yj)=pijP(X = x_i, Y = y_j) = p_{ij},当 pj>0p_{\cdot j} > 0 时,称
P(X=xiY=yj)=pijpjP(X = x_i \mid Y = y_j) = \frac{p_{ij}}{p_{\cdot j}}
为已知 Y=yjY = y_jXX 的条件分布列。同理,称
P(Y=yjX=xi)=pijpiP(Y = y_j \mid X = x_i) = \frac{p_{ij}}{p_{i \cdot}}
为已知 X=xiX = x_iYY 的条件分布列。


3.2.3 连续情形

对于连续型随机变量,由于对任意 yy 都有 P(Y=y)=0P(Y = y) = 0,无法直接用条件概率计算。需通过极限方式定义条件分布函数:

设条件分布函数
F(xy)=P(XxY=y)F(x \mid y) = P(X \leq x \mid Y = y)
可视为当 Δy0\Delta y \to 0P(Xxy<Yy+Δy)P(X \leq x \mid y < Y \leq y + \Delta y) 的极限。通过推导可得:
F(xy)=limΔy0xf(u,y)duΔyfY(y)Δy=xf(u,y)dufY(y).F(x \mid y) = \lim_{\Delta y \to 0} \frac{\int_{-\infty}^x f(u, y) \, du \cdot \Delta y}{f_Y(y) \cdot \Delta y} = \frac{\int_{-\infty}^x f(u, y) \, du}{f_Y(y)}.

定义3.6(X,Y)(X, Y) 为二维连续型随机变量,称
f(xy)=f(x,y)fY(y)f(x \mid y) = \frac{f(x, y)}{f_Y(y)}
为已知 Y=yY = yXX 的条件概率密度。同理,称
f(yx)=f(x,y)fX(x)f(y \mid x) = \frac{f(x, y)}{f_X(x)}
为已知 X=xX = xYY 的条件概率密度。


例3.7 二维正态分布的条件分布

(X,Y)N(μ1,μ2,σ12,σ22,ρ)(X, Y) \sim N(\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho),则:

  1. 已知 Y=yY = yXX 的条件概率密度
    f(xy)=12π(1ρ2)σ1exp([x(μ1+σ1σ2ρ(yμ2))]22(1ρ2)σ12).f(x \mid y) = \frac{1}{\sqrt{2\pi(1-\rho^2)}\sigma_1} \exp\left(-\frac{\left[x - \left(\mu_1 + \frac{\sigma_1}{\sigma_2}\rho(y - \mu_2)\right)\right]^2}{2(1-\rho^2)\sigma_1^2}\right).
    此时 XY=yX \mid Y = y 服从正态分布 N(μ1+σ1σ2ρ(yμ2),(1ρ2)σ12)N\left(\mu_1 + \frac{\sigma_1}{\sigma_2}\rho(y - \mu_2), (1-\rho^2)\sigma_1^2\right)

  2. 已知 X=xX = xYY 的条件概率密度
    f(yx)=12π(1ρ2)σ2exp([y(μ2+σ2σ1ρ(xμ1))]22(1ρ2)σ22).f(y \mid x) = \frac{1}{\sqrt{2\pi(1-\rho^2)}\sigma_2} \exp\left(-\frac{\left[y - \left(\mu_2 + \frac{\sigma_2}{\sigma_1}\rho(x - \mu_1)\right)\right]^2}{2(1-\rho^2)\sigma_2^2}\right).
    此时 YX=xY \mid X = x 服从正态分布 N(μ2+σ2σ1ρ(xμ1),(1ρ2)σ22)N\left(\mu_2 + \frac{\sigma_2}{\sigma_1}\rho(x - \mu_1), (1-\rho^2)\sigma_2^2\right)

结论:多维正态分布的条件分布仍为正态分布。

© 2025 All rights reservedBuilt with Flowershow Cloud

Built with LogoFlowershow Cloud