我们把只包含 两个 可能结果的试验叫做 伯努利试验,独立地重复进行 n 次所组成的随机试验称为 n 重伯努利试验。
在 n 重伯努利试验中,设每次试验中事件 A 发生的概率为 p,发生的次数为 X,则有:
P(X=k)=Cnkpk(1−p)n−k
如果随机变量 X 的分布列具有上式的形式,则称随机变量 X 服从 二项分布,记作:
X∼B(n,p)
由 二项式定理,容易得到:
k=0∑nP(X=k)=k=0∑nCnkpk(1−p)n−k=[p+(1−p)]n=1
超几何分布:假设一批产品共 N 件,其中有 M≤N 件次品。从 N 件产品中随机不放回抽取 n≤N 件,用 X 表示抽取的次品数,则有:
P(X=k)=CNnCMkCN−Mn−k
E(X)=NnM,D(X)=N2(N−1)nM(N−M)(N−n)
与二项分布相比,超几何分布更集中在均值附近。
正态分布(高斯分布)是一种 连续 的概率分布,可以看作二项分布的极限情况。
正态分布的解析式:
f(x)=σ2π1e−2σ2(x−μ)2
其中 μ∈R,σ>0 为参数。对 ∀x∈R,f(x)>0,可以用积分证明 x 轴与曲线之间的区域面积为 1。称 f(x) 为正态密度函数,图像为正态( 密度 )曲线。X 服从正态分布,记为:
X∼N(μ,σ2)
E(X)=μ,D(X)=σ2
特别地,当 μ=0,σ=1 时称 X 服从标准正态分布。
正态分布的特点:
- 曲线是单峰的,关于 x=μ 对称;在 x=μ 达到峰值 σ2π1。
- lim∣x∣→∞f(x)=0。
- 当 σ 较小时,曲线“瘦高”,反之“矮胖”。
常用取值:
P(μ−σ≤X≤μ+σ)≈0.6827
P(μ−1.96σ≤X≤μ+1.96σ)=0.95
P(μ−2σ≤X≤μ+2σ)≈0.9545
P(μ−2.58σ≤X≤μ+2.58σ)=0.99
P(μ−3σ≤X≤μ+3σ)≈0.9973
3σ 原则:服从于正态分布 N(μ,σ2) 的随机变量通常只取 [μ−3σ,μ+3σ] 之间的值。