概率论 是「已知分布、推断样本」;数理统计 是反过来「已知样本、推断分布」。
两大基本任务:
- 参数估计:用样本估计未知参数。
- 假设检验:用样本判断关于总体的命题是否成立。
- 总体 X:研究对象的全体,由其分布描述。
- 样本 X1,…,Xn:从总体独立同分布抽取的 n 个观测值。
- 样本容量:n。
样本的 函数 T(X1,…,Xn)(不含未知参数)。常见统计量:
| 名称 | 定义 |
|---|
| 样本均值 | Xˉ=n1∑i=1nXi |
| 样本方差 | S2=n−11∑i=1n(Xi−Xˉ)2 |
| 样本标准差 | S=S2 |
| k 阶样本原点矩 | Ak=n1∑i=1nXik |
| k 阶样本中心矩 | Bk=n1∑i=1n(Xi−Xˉ)k |
样本方差分母是 n−1 而不是 n,这是为了让 S2 是 σ2 的 无偏估计——这一点详见参数估计。
设 X1,…,Xn 来自 N(0,1)。
χ2=i=1∑nXi2∼χ2(n)
n 为 自由度。E(χ2)=n,D(χ2)=2n。
设 X∼N(0,1),Y∼χ2(n),X,Y 独立,则:
T=Y/nX∼t(n)
t 分布关于 0 对称,n→∞ 时趋于 N(0,1)。
设 U∼χ2(m),V∼χ2(n),独立,则:
F=V/nU/m∼F(m,n)
设 X1,…,Xn i.i.d. ∼N(μ,σ2),则:
Xˉ∼N(μ,nσ2),σ2(n−1)S2∼χ2(n−1)
Xˉ 与 S2 相互独立。
S/nXˉ−μ∼t(n−1)
用一个数估计未知参数。两大方法:
| 方法 | 思想 |
|---|
| 矩估计 | 用样本矩去估计总体矩,列方程求参数 |
| 极大似然估计 | 选使 样本观测值出现概率最大 的参数值 |
- 无偏性:E(θ^)=θ。
- 有效性:在无偏估计中方差最小。
- 一致性:θ^Pθ(依概率收敛)。
给出参数的 置信区间 [θ^1,θ^2],使:
P(θ^1≤θ≤θ^2)=1−α
1−α 称为 置信水平(常取 0.95 或 0.99)。
正态总体均值 μ 的置信区间(方差未知):
[Xˉ−nStα/2(n−1),Xˉ+nStα/2(n−1)]
- 提出 原假设 H0 与 备择假设 H1。
- 构造合适的 检验统计量。
- 给定 显著性水平 α,确定 拒绝域。
- 由样本计算统计量,判断是否落入拒绝域;若落入则拒绝 H0。
| H0 为真 | H0 为假 |
|---|
| 拒绝 H0 | 第一类错误(弃真),概率 α | 判断正确 |
| 接受 H0 | 判断正确 | 第二类错误(取伪),概率 β |
α 越小,越「保守」(不轻易拒绝 H0),但 β 越大。
| 条件 | 统计量 | 服从 |
|---|
| Z 检验 | σ2 已知 | Z=σ/nXˉ−μ0 | N(0,1) |
| t 检验 | σ2 未知 | T=S/nXˉ−μ0 | t(n−1) |
方差检验用 χ2 分布,两总体方差比较用 F 分布。