跳到主要内容

数字特征

参考资料

引入

完整的分布信息往往太繁,数字特征 用少量数字抓住分布的本质:

  • 期望:分布的「中心」。
  • 方差:分布的「离散程度」。
  • 协方差 / 相关系数:两个变量的「联动程度」。

数学期望

定义

离散:E(X)=ixipiE(X)=\sum_i x_i p_i(要求级数 绝对收敛)。

连续:E(X)=+xf(x)dxE(X)=\int_{-\infty}^{+\infty}xf(x)\,\mathrm{d}x(要求积分 绝对收敛)。

随机变量函数的期望

E(g(X))=ig(xi)pi=+g(x)f(x)dxE(g(X))=\sum_i g(x_i)p_i=\int_{-\infty}^{+\infty}g(x)f(x)\,\mathrm{d}x

性质

E(c)=c,E(cX)=cE(X),E(X+Y)=E(X)+E(Y)E(c)=c,\quad E(cX)=cE(X),\quad E(X+Y)=E(X)+E(Y)

X,YX,Y 独立 时:

E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)

方差与标准差

定义

D(X)=Var(X)=E((XE(X))2)=E(X2)[E(X)]2D(X)=\operatorname{Var}(X)=E\big((X-E(X))^2\big)=E(X^2)-[E(X)]^2

标准差 σ(X)=D(X)\sigma(X)=\sqrt{D(X)},与 XX 同量纲。

性质

D(c)=0,D(cX)=c2D(X),D(X±c)=D(X)D(c)=0,\quad D(cX)=c^2 D(X),\quad D(X\pm c)=D(X)

X,YX,Y 独立 时:

D(X±Y)=D(X)+D(Y)D(X\pm Y)=D(X)+D(Y)

标准化变量

X=XE(X)σ(X)E(X)=0,D(X)=1X^*=\frac{X-E(X)}{\sigma(X)}\Rightarrow E(X^*)=0,D(X^*)=1

常见分布的期望与方差

分布记号E(X)E(X)D(X)D(X)
0-1 分布B(1,p)B(1,p)ppp(1p)p(1-p)
二项分布B(n,p)B(n,p)npnpnp(1p)np(1-p)
泊松分布P(λ)P(\lambda)λ\lambdaλ\lambda
几何分布G(p)G(p)1p\dfrac{1}{p}1pp2\dfrac{1-p}{p^2}
均匀分布U(a,b)U(a,b)a+b2\dfrac{a+b}{2}(ba)212\dfrac{(b-a)^2}{12}
指数分布E(λ)E(\lambda)1λ\dfrac{1}{\lambda}1λ2\dfrac{1}{\lambda^2}
正态分布N(μ,σ2)N(\mu,\sigma^2)μ\muσ2\sigma^2
提示

记忆口诀:泊松分布的期望和方差都等于 λ\lambda——这是它最显著的标志。

正态分布的两个参数就是它的期望和方差,记号 N(μ,σ2)N(\mu,\sigma^2) 直接告诉你答案。

协方差与相关系数

协方差

Cov(X,Y)=E((XE(X))(YE(Y)))=E(XY)E(X)E(Y)\operatorname{Cov}(X,Y)=E\big((X-E(X))(Y-E(Y))\big)=E(XY)-E(X)E(Y)

性质:

Cov(X,X)=D(X),Cov(X,Y)=Cov(Y,X)\operatorname{Cov}(X,X)=D(X),\quad \operatorname{Cov}(X,Y)=\operatorname{Cov}(Y,X) Cov(aX+b,cY+d)=acCov(X,Y)\operatorname{Cov}(aX+b,cY+d)=ac\operatorname{Cov}(X,Y) D(X±Y)=D(X)+D(Y)±2Cov(X,Y)D(X\pm Y)=D(X)+D(Y)\pm 2\operatorname{Cov}(X,Y)

相关系数

ρXY=Cov(X,Y)D(X)D(Y)\rho_{XY}=\frac{\operatorname{Cov}(X,Y)}{\sqrt{D(X)D(Y)}}

ρXY[1,1]\rho_{XY}\in[-1,1],刻画 线性相关程度

  • ρXY=1\rho_{XY}=1:完全正相关(Y=aX+b,a>0Y=aX+b,a>0)。
  • ρXY=1\rho_{XY}=-1:完全负相关。
  • ρXY=0\rho_{XY}=0线性不相关(注意不是「独立」)。

独立与不相关

X,YX,Y 独立 \Rightarrow 不相关(Cov=0\operatorname{Cov}=0);反之不成立

唯一例外:若 (X,Y)(X,Y) 服从 二维正态分布,则「不相关」与「独立」等价。

XXkk 阶原点矩E(Xk)E(X^k)

XXkk 阶中心矩E((XE(X))k)E((X-E(X))^k)

  • 一阶原点矩 = 期望。
  • 二阶中心矩 = 方差。
  • 三阶中心矩与 偏度、四阶中心矩与 峰度 相关。