跳到主要内容

特征值与相似矩阵

参考资料

引入

把矩阵看作 线性变换特征向量 就是「方向不变」的向量,特征值 是它被拉伸的倍数:

Aξ=λξA\vec\xi=\lambda\vec\xi

特征值分解把复杂的矩阵变换 分解为各个方向上的简单伸缩,是线代后半段的核心。

特征值与特征向量

定义

AAnn 阶方阵,若存在数 λ\lambda非零向量 ξ\vec\xi 使:

Aξ=λξA\vec\xi=\lambda\vec\xi

λ\lambdaAA特征值ξ\vec\xi 是对应于 λ\lambda特征向量

求解

(AλE)ξ=0(A-\lambda E)\vec\xi=\vec 0 有非零解,得 特征方程

AλE=0|A-\lambda E|=0

展开得 特征多项式,求根得到所有特征值。对每个 λi\lambda_i(AλiE)x=0(A-\lambda_i E)\vec x=\vec 0 得特征向量。

性质

AA 的特征值为 λ1,λ2,,λn\lambda_1,\lambda_2,\dots,\lambda_n,则:

i=1nλi=tr(A)=i=1naii\sum_{i=1}^{n}\lambda_i=\operatorname{tr}(A)=\sum_{i=1}^{n}a_{ii} i=1nλi=A\prod_{i=1}^{n}\lambda_i=|A|
矩阵特征值
AAλ\lambda
kAkAkλk\lambda
AmA^mλm\lambda^m
A1A^{-1}AA 可逆)1λ\dfrac{1}{\lambda}
ATA^Tλ\lambda(与 AA 相同)
f(A)f(A)f(λ)f(\lambda)

特征向量在以上变换下 保持不变

重要结论

  • 不同特征值对应的特征向量 线性无关
  • kk 重特征值 λ\lambda 对应的线性无关特征向量个数 k\le k

相似矩阵

定义

若存在可逆矩阵 PP 使:

P1AP=BP^{-1}AP=B

则称 AA 相似于 BB,记为 ABA\sim B

性质

相似矩阵具有相同的:

  • 行列式:A=B|A|=|B|
  • 秩:r(A)=r(B)r(A)=r(B)
  • 迹:tr(A)=tr(B)\operatorname{tr}(A)=\operatorname{tr}(B)
  • 特征多项式与特征值。
  • 可逆性。
提示

相似的本质:同一个线性变换不同基下 的矩阵表示。 PP 就是基变换矩阵。

相似对角化

定义

AΛA\sim\LambdaΛ\Lambda 为对角阵),称 AA对角化

充要条件

AA 可对角化     A\iff Ann线性无关 的特征向量。

等价表述:每个 kk 重特征值对应恰好 kk 个线性无关特征向量。

对角化步骤

  1. 求特征值 λ1,,λn\lambda_1,\dots,\lambda_n
  2. 对每个 λi\lambda_i 求特征向量。
  3. 若得到 nn 个线性无关特征向量 ξ1,,ξn\vec\xi_1,\dots,\vec\xi_n,令 P=(ξ1,,ξn)P=(\vec\xi_1,\dots,\vec\xi_n),则:
P1AP=diag(λ1,,λn)P^{-1}AP=\operatorname{diag}(\lambda_1,\dots,\lambda_n)

应用:求矩阵的幂

A=PΛP1A=P\Lambda P^{-1},则:

Ak=PΛkP1=Pdiag(λ1k,,λnk)P1A^k=P\Lambda^k P^{-1}=P\operatorname{diag}(\lambda_1^k,\dots,\lambda_n^k)P^{-1}

实对称矩阵

实对称矩阵(AT=AA^T=A)具有特别好的性质:

  • 所有特征值都是 实数
  • 不同特征值的特征向量 互相正交
  • 一定可以 正交对角化:存在正交矩阵 QQ 使:
QTAQ=Q1AQ=ΛQ^T A Q=Q^{-1}AQ=\Lambda

正交对角化步骤

  1. 求特征值与特征向量。
  2. 对每个 kk 重特征值,把对应的 kk 个特征向量用 施密特正交化
  3. 把所有特征向量 单位化,拼成正交矩阵 QQ

施密特正交化

设线性无关组 α1,α2,\vec\alpha_1,\vec\alpha_2,\dots

β1=α1\vec\beta_1=\vec\alpha_1 β2=α2(α2,β1)(β1,β1)β1\vec\beta_2=\vec\alpha_2-\frac{(\vec\alpha_2,\vec\beta_1)}{(\vec\beta_1,\vec\beta_1)}\vec\beta_1 βk=αki=1k1(αk,βi)(βi,βi)βi\vec\beta_k=\vec\alpha_k-\sum_{i=1}^{k-1}\frac{(\vec\alpha_k,\vec\beta_i)}{(\vec\beta_i,\vec\beta_i)}\vec\beta_i

再单位化:ei=βiβi\vec e_i=\dfrac{\vec\beta_i}{\|\vec\beta_i\|}