3.2.2 离散情形
对于离散型随机变量,可直接用条件概率计算。
定义3.5 若 (X,Y) 的联合分布列为 P(X=xi,Y=yj)=pij,当 p⋅j>0 时,称
P(X=xi∣Y=yj)=p⋅jpij
为已知 Y=yj 时 X 的条件分布列。同理,称
P(Y=yj∣X=xi)=pi⋅pij
为已知 X=xi 时 Y 的条件分布列。
3.2.3 连续情形
对于连续型随机变量,由于对任意 y 都有 P(Y=y)=0,无法直接用条件概率计算。需通过极限方式定义条件分布函数:
设条件分布函数
F(x∣y)=P(X≤x∣Y=y)
可视为当 Δy→0 时 P(X≤x∣y<Y≤y+Δy) 的极限。通过推导可得:
F(x∣y)=limΔy→0fY(y)⋅Δy∫−∞xf(u,y)du⋅Δy=fY(y)∫−∞xf(u,y)du.
定义3.6 若 (X,Y) 为二维连续型随机变量,称
f(x∣y)=fY(y)f(x,y)
为已知 Y=y 时 X 的条件概率密度。同理,称
f(y∣x)=fX(x)f(x,y)
为已知 X=x 时 Y 的条件概率密度。
例3.7 二维正态分布的条件分布
若 (X,Y)∼N(μ1,μ2,σ12,σ22,ρ),则:
-
已知 Y=y 时 X 的条件概率密度为
f(x∣y)=2π(1−ρ2)σ11exp(−2(1−ρ2)σ12[x−(μ1+σ2σ1ρ(y−μ2))]2).
此时 X∣Y=y 服从正态分布 N(μ1+σ2σ1ρ(y−μ2),(1−ρ2)σ12)。
-
已知 X=x 时 Y 的条件概率密度为
f(y∣x)=2π(1−ρ2)σ21exp(−2(1−ρ2)σ22[y−(μ2+σ1σ2ρ(x−μ1))]2).
此时 Y∣X=x 服从正态分布 N(μ2+σ1σ2ρ(x−μ1),(1−ρ2)σ22)。
结论:多维正态分布的条件分布仍为正态分布。