Skip to main content

随机事件与概率

参考资料

引入

概率论 用数学语言刻画 不确定性。从「掷骰子」「抽卡」「天气预报」到机器学习的不确定性建模,本质都是 随机事件概率 的运用。

基本概念

样本空间

随机试验所有可能结果的 集合,记为 Ω\Omega。每个结果 ωΩ\omega\in\Omega 称为 样本点

随机事件

样本空间的 子集 AΩA\subseteq\Omega,是若干样本点的集合。

  • 必然事件 Ω\Omega
  • 不可能事件 \varnothing
  • 基本事件:仅含一个样本点 {ω}\set{\omega}

事件运算

参见 集合

概率论术语集合论含义
AABB 之和ABA\cup BA,BA,B 至少一个发生
AABB 之积ABA\cap BABABA,BA,B 同时发生
AABB 之差ABA\setminus BAA 发生而 BB 不发生
对立(互补)Aˉ=ΩA\bar A=\Omega\setminus AAA 不发生
互斥(不相容)AB=A\cap B=\varnothingA,BA,B 不能同时发生

概率

公理化定义(Kolmogorov)

满足以下三条公理的实函数 P:2Ω[0,1]P:2^\Omega\to[0,1]

  1. 非负性P(A)0P(A)\ge 0
  2. 规范性P(Ω)=1P(\Omega)=1
  3. 可列可加性A1,A2,A_1,A_2,\dots 两两互斥时,P ⁣(Ai)=P(Ai)P\!\left(\bigcup A_i\right)=\sum P(A_i)

基本性质

P()=0,P(Aˉ)=1P(A)P(\varnothing)=0,\quad P(\bar A)=1-P(A) P(AB)=P(A)+P(B)P(AB)P(A\cup B)=P(A)+P(B)-P(AB) ABP(A)P(B)A\subseteq B\Rightarrow P(A)\le P(B)

古典概型

样本空间 有限、各样本点 等可能 时:

P(A)=AΩ=A 中样本点数Ω 中样本点数P(A)=\frac{|A|}{|\Omega|}=\frac{A\text{ 中样本点数}}{\Omega\text{ 中样本点数}}

计算技巧依赖 计数原理(排列、组合、容斥)。

几何概型

样本空间是 几何区域、概率正比于 度量(长度/面积/体积):

P(A)=m(A)m(Ω)P(A)=\frac{m(A)}{m(\Omega)}

条件概率

P(B)>0P(B)>0,定义在 BB 发生条件下 AA 的概率:

P(AB)=P(AB)P(B)P(A\mid B)=\frac{P(AB)}{P(B)}

乘法公式

P(AB)=P(A)P(BA)=P(B)P(AB)P(AB)=P(A)P(B\mid A)=P(B)P(A\mid B)

推广:

P(A1A2An)=P(A1)P(A2A1)P(A3A1A2)P(AnA1An1)P(A_1A_2\cdots A_n)=P(A_1)P(A_2\mid A_1)P(A_3\mid A_1A_2)\cdots P(A_n\mid A_1\cdots A_{n-1})

全概率公式

B1,,BnB_1,\dots,B_nΩ\Omega 的一个 划分(两两互斥,并为 Ω\Omega):

P(A)=i=1nP(Bi)P(ABi)P(A)=\sum_{i=1}^{n}P(B_i)P(A\mid B_i)

贝叶斯公式

P(BkA)=P(Bk)P(ABk)i=1nP(Bi)P(ABi)P(B_k\mid A)=\frac{P(B_k)P(A\mid B_k)}{\sum_{i=1}^{n}P(B_i)P(A\mid B_i)}
tip

贝叶斯公式的直观理解:先验 P(Bk)P(B_k) → 观察到证据 AA → 更新得 后验 P(BkA)P(B_k\mid A)。 这是现代统计学与机器学习的核心思想。

事件的独立性

A,BA,B 独立     P(AB)=P(A)P(B)    P(AB)=P(A)\iff P(AB)=P(A)P(B)\iff P(A\mid B)=P(A)

注意:独立 \ne 互斥。互斥事件除非至少一个概率为 00,否则不独立。

多事件独立

nn 个事件 两两独立相互独立必要非充分 条件。相互独立要求所有 2kn2\le k\le n 个事件的乘积概率都等于各自概率之积。

伯努利试验

nn 次独立重复的「成功 / 失败」试验,每次成功概率为 pp,则恰好 kk 次成功的概率为:

P(X=k)=(nk)pk(1p)nkP(X=k)=\binom{n}{k}p^k(1-p)^{n-k}

二项分布 XB(n,p)X\sim B(n,p),详见 随机变量与分布