随机变量(RV)把 随机事件 数值化:定义在样本空间上的 实值函数 X:Ω→R。
研究随机变量的关键是它的 分布——它取各个值的「概率规律」。
对任意 x∈R:
F(x)=P(X≤x)
称为 累积分布函数(CDF)。性质:
- 单调不减、右连续。
- F(−∞)=0,F(+∞)=1。
- P(a<X≤b)=F(b)−F(a)。
取值 可列,由 分布列(PMF)pi=P(X=xi) 确定,满足 ∑pi=1。
| 分布 | 记号 | 分布列 | 含义 |
|---|
| 0-1 分布 | B(1,p) | P(X=1)=p,P(X=0)=1−p | 单次伯努利试验 |
| 二项分布 | B(n,p) | P(X=k)=(kn)pk(1−p)n−k | n 次独立成功次数 |
| 泊松分布 | P(λ) | P(X=k)=k!λke−λ | 单位时间事件发生次数 |
| 几何分布 | G(p) | P(X=k)=(1−p)k−1p | 首次成功所需次数 |
| 超几何分布 | — | P(X=k)=(nN)(kM)(n−kN−M) | 不放回抽样 |
二项→泊松:当 n→∞,p→0 且 np→λ 时,B(n,p) 趋于 P(λ)。
工程上常以 n≥20,p≤0.05 作为近似阈值。
存在 概率密度函数(PDF)f(x)≥0 使:
F(x)=∫−∞xf(t)dt,∫−∞+∞f(x)dx=1
对单点 P(X=a)=0;区间概率:
P(a<X≤b)=∫abf(x)dx
在 f 连续处 F′(x)=f(x)。
| 分布 | 记号 | 密度 |
|---|
| 均匀分布 | U(a,b) | f(x)=b−a1(a≤x≤b) |
| 指数分布 | E(λ) | f(x)=λe−λx(x≥0) |
| 正态分布 | N(μ,σ2) | f(x)=2πσ1exp(−2σ2(x−μ)2) |
Z∼N(0,1),密度记作 φ(z),分布函数记作 Φ(z)。
标准化:X∼N(μ,σ2)⇒Z=σX−μ∼N(0,1)。
3σ 原则:
P(∣X−μ∣<σ)≈0.6827,P(∣X−μ∣<2σ)≈0.9545,P(∣X−μ∣<3σ)≈0.9973
设 Y=g(X),求 Y 的分布。
P(Y=yk)=g(xi)=yk∑P(X=xi)
若 g 严格单调且可导:
fY(y)=fX(g−1(y))⋅dydg−1(y)
二维离散:pij=P(X=xi,Y=yj)。
二维连续:联合密度 f(x,y)≥0 满足 ∬f=1,
P((X,Y)∈D)=∬Df(x,y)dxdy
fX(x)=∫−∞+∞f(x,y)dy,fY(y)=∫−∞+∞f(x,y)dx
fY∣X(y∣x)=fX(x)f(x,y)(fX(x)>0)
X,Y 独立 ⟺F(x,y)=FX(x)FY(y)⟺f(x,y)=fX(x)fY(y)。