Bootstrap

矩阵的相似标准形

第0章 复习与引申
第1章 线性空间与线性变换
第2章 内积空间和等距变换
第3章 矩阵的相似标准形
第4章 Hermite二次型
第5章 范数和矩阵函数
第6章 广义逆矩阵

第3章 矩阵的相似标准形

1 特征值与特征向量

矩阵的特征值和特征向量的定义:设 A A A n n n阶方阵, λ 0 \lambda_0 λ0是数,若存在 n n n维列向量 η \eta η,使得 η ≠ θ \eta\neq\theta η=θ,且 A η = λ 0 η A\eta=\lambda_0\eta Aη=λ0η,则称 λ 0 \lambda_0 λ0 A A A特征值 η \eta η A A A的属于特征值 λ 0 \lambda_0 λ0特征向量

矩阵的相似对角阵存在定理:设 A A A n n n阶方阵,则 A A A相似于对角阵的充分必要条件是 A A A n n n个线性无关向量。

**线性变换的特征值和特征向量的定义:**设 f f f是线性空间 V V V上的线性变换,设 λ 0 ∈ C \lambda_0\in C λ0C,若存在 η ∈ V \eta\in V ηV使得 θ ≠ η ∈ V \theta\neq\eta\in V θ=ηV f ( η ) = λ 0 η f(\eta)=\lambda_0\eta f(η)=λ0η,则称 λ 0 \lambda_0 λ0是线性变换 f f f的特征值, η \eta η是相应于 λ 0 \lambda_0 λ0的特征向量。

线性变换的可对角化定理:设 V V V n n n维线性空间, f f f V V V上的线性变换,则存在 V V V的基使得 f f f的矩阵是对角阵当且仅当 f f f n n n个线性无关的特征向量。

线性变换特征值和特征向量的计算:设 f f f V V V的基 α 1 , ⋯   , α n \alpha_1,\cdots,\alpha_n α1,,αn下,若 λ 0 ∈ C , η ∈ V \lambda_0\in C, \eta\in V λ0C,ηV在基 α 1 , ⋯   , α n \alpha_1,\cdots,\alpha_n α1,,αn下的坐标是 x 0 x_0 x0,则 f ( η ) f(\eta) f(η)在基 α 1 , ⋯   , α n \alpha_1,\cdots,\alpha_n α1,,αn下的坐标为 A x 0 Ax_0 Ax0,所以:
f ( η ) = λ 0 η    ⟺    A x 0 = λ 0 x 0 f(\eta)=\lambda_0\eta\iff Ax_0=\lambda_0 x_0 f(η)=λ0ηAx0=λ0x0
​ 即: η \eta η f f f属于特征值 λ 0 \lambda_0 λ0的特征向量当且仅当 x 0 x_0 x0 A A A的属于特征值 λ 0 \lambda_0 λ0的特征向量。( η = ( α 1 , ⋯   , α n ) x 0 \eta=(\alpha_1,\cdots,\alpha_n)x_0 η=(α1,,αn)x0

矩阵相似定理:若 A , B ∈ C n × n A,B\in C^{n\times n} A,BCn×n是相似的,则 ∣ λ I − A ∣ = ∣ λ I − B ∣ |\lambda I-A|=|\lambda I-B| λIA=λIB;(逆命题不成立,可定义线性变换的特征多项式)。

特征多项式

特征多项式的定义: f f f V V V的基 α 1 , ⋯   , α n \alpha_1,\cdots,\alpha_n α1,,αn下的矩阵为 A A A,则称 ∣ λ I − A ∣ |\lambda I- A| λIA f f f特征多项式。(与基的选取无关,因为不同基下的矩阵相似,而相似矩阵的特征多项式相等)

k k k阶主子式的定义:设矩阵 A = ( a i j ) n × n , 1 ≤ i 1 ≤ i 2 ≤ ⋯ ≤ i k ≤ n A=(a_{ij})_{n\times n},1\leq i_1\leq i_2\leq\cdots\leq i_k\leq n A=(aij)n×n,1i1i2ikn,则 A A A的第 i 1 , i 2 , ⋯   , i k i_1,i_2,\cdots,i_k i1,i2,,ik行、第 i 1 , i 2 , ⋯   , i k i_1,i_2,\cdots,i_k i1,i2,,ik交叉处的元素构成的 k k k阶子式称为 A A A k k k阶主子式。

k k k阶子式( ( C n k ) 2 (C_n^k)^2 (Cnk)2个), k k k阶主子式( C n k C_n^k Cnk个), k k k阶顺序主子式(1个),

特征多项式的定理:设矩阵 A = ( a i j ) n × n A=(a_{ij})_{n\times n} A=(aij)n×n,则 ∣ λ I − A ∣ = λ n + b 1 λ n − 1 + b 2 λ n − 2 + ⋯ + b k λ n − k + ⋯ + b n − 1 λ + b n |\lambda I-A|=\lambda^n+b_1\lambda^{n-1}+b_2\lambda^{n-2}+\cdots+b_k\lambda^{n-k}+\cdots+b_{n-1}\lambda+b_n λIA=λn+b1λn1+b2λn2++bkλnk++bn1λ+bn,其中 b j = ( − 1 ) j ∑ ( A 的 所 有 j 阶 主 子 式 ) b_j=(-1)^j\sum(A的所有j阶主子式) bj=(1)j(Aj),特别的, b 1 = − ∑ i n a i i , b n = ( − 1 ) n ∣ A ∣ b_1=-\sum_{i}^na_{ii},b_n=(-1)^n|A| b1=inaii,bn=(1)nA

矩阵的迹的定义:设矩阵 A = ( a i j ) n × n A=(a_{ij})_{n\times n} A=(aij)n×n,称 ∑ i n a i i \sum_{i}^na_{ii} inaii为矩阵的迹,记为 t r ( A ) tr(A) tr(A)

  1. A = ( a i j ) n × n A=(a_{ij})_{n\times n} A=(aij)n×n的特征值为 λ 1 , ⋯   , λ n \lambda_1,\cdots,\lambda_n λ1,,λn,则 t r ( A ) = ∑ i = 1 n λ i , ∣ A ∣ = ∏ i = 1 n λ i tr(A)=\sum_{i=1}^n\lambda_i,|A|=\prod_{i=1}^n\lambda_i tr(A)=i=1nλiA=i=1nλi
  2. A , B A,B A,B相似,则 t r ( A ) = t r ( B ) , ∣ A ∣ = ∣ B ∣ tr(A)=tr(B),|A|=|B| tr(A)=tr(B),A=B。( α β H \alpha\beta^H αβH的特征值计算,)

化零多项式的定义:设 f ( x ) f(x) f(x)是多项式,若 f ( A ) = 0 f(A)=0 f(A)=0,则 A A A的特征值均是 f ( x ) = 0 f(x)=0 f(x)=0的根。

Hamilton-Cayley定义

Schur引理:对于 ∀ A ∈ C n × n \forall A\in C^{n\times n} ACn×n,存在酉矩阵 U U U使得 U H A U U^HAU UHAU是上三角矩阵。

定理:设 A ∈ F n × n , C ( λ ) = ∣ λ I − A ∣ A\in F^{n\times n},C(\lambda)=|\lambda I-A| AFn×n,C(λ)=λIA,则 C ( A ) = 0 C(A)=0 C(A)=0

定理:设 f ∈ H o m ( V , V ) , C ( λ ) f\in Hom(V,V),C(\lambda) fHom(V,V),C(λ) f f f的特征多项式,则 C ( f ) = O C(f)=O C(f)=O

例题:对于矩阵 A = ( 3 0 8 3 1 6 − 2 0 − 5 ) A=\begin{pmatrix} 3&0&8\\3&1&6\\-2&0&-5 \end{pmatrix} A=332010865,求 A 100 − 2 A 50 A^{100}-2A^{50} A1002A50

  1. 计算出矩阵 A A A的特征多项式 C ( λ ) = ∣ λ I − A ∣ = ( λ − 1 ) ( λ + 1 ) 2 C(\lambda)=|\lambda I-A|=(\lambda-1)(\lambda+1)^2 C(λ)=λIA=(λ1)(λ+1)2;(特征值为1,-1二重)

  2. 构造函数 f ( λ ) = λ 100 − 2 λ 50 f(\lambda)=\lambda^{100}-2\lambda^{50} f(λ)=λ1002λ50

  3. 对函数做带余除法 f ( λ ) = C ( λ ) q ( λ ) + a λ 2 + b λ + c f(\lambda)=C(\lambda)q(\lambda)+a\lambda^2+b\lambda+c f(λ)=C(λ)q(λ)+aλ2+bλ+c;( f ( A ) = C ( A ) q ( A ) + a A 2 + b A + c = a A 2 + b A + c f(A)=C(A)q(A)+aA^2+bA+c=aA^2+bA+c f(A)=C(A)q(A)+aA2+bA+c=aA2+bA+c

  4. 因此可以将特征值带入,得:
    a + b + c = − 1 a − b + c = − 1 2 a − b = 0 ( 二 重 根 ) a+b+c=-1\\ a-b+c=-1\\ 2a-b=0(二重根) a+b+c=1ab+c=12ab=0()

矩阵的最小多项式

最小多项式的定义:矩阵 A A A次数最低的最高次项系数为一的化零多项式称为 A A A的最小多项式。

最小多项式的性质:

  1. m ( x ) , φ ( x ) m(x),\varphi(x) m(x),φ(x)分别是矩阵 A A A的最小多项式和化零多项式,则 m ( x ) m(x) m(x)可以整除 φ ( x ) \varphi(x) φ(x),记为 m ( x ) ∣ φ ( x ) m(x)|\varphi(x) m(x)φ(x)
  2. 任意矩阵的最小多项式是唯一的;
  3. 如果矩阵 A , B A,B A,B相似,则 A , B A,B A,B有相同的最小多项式。

线性变换的最小多项式:设线性变换 f ∈ V f\in V fV V V V的一组基下的矩阵为 A A A A A A的最小多项式称为 f f f的最小多项式。即线性变换 f f f次数最低的、最高次项系数为1的化零多项式称为 f f f的最小多项式。

最小多项式定理:设 m ( x ) , C ( x ) m(x),C(x) m(x),C(x)分别是矩阵 A A A的最小多项式和特征多项式,则 m ( x ) ∣ C ( x ) m(x)|C(x) m(x)C(x),并且对于 λ 0 ∈ C , m ( λ 0 ) = 0    ⟺    C ( λ ) = 0 \lambda_0\in C,m(\lambda_0)=0\iff C(\lambda)=0 λ0C,m(λ0)=0C(λ)=0。(求最小多项式:先求特征多项式,找出满足矩阵A的化零多项式,最小阶数的化零多项式为最小多项式)

2 可对角化问题

  1. 矩阵 A n × n A_{n\times n} An×n相似于对角阵    ⟺    \iff A A A n n n个线性无关的特征向量;
  2. 矩阵属于不同特征值的特征向量线性无关
  3. λ 1 , λ 2 , ⋯   , λ s \lambda_1,\lambda_2,\cdots,\lambda_s λ1,λ2,,λs是矩阵 A A A的互不相同的特征值, η 1 i , η 2 i , ⋯   , η t i i \eta_{1i},\eta_{2i},\cdots,\eta_{t_i i} η1i,η2i,,ηtii A A A相应于特征值 λ i \lambda_i λi的线性无关的特征向量,则 η 11 , η 21 , ⋯   , η t 1 1 , η 12 , η 22 , ⋯   , η t 2 2 , ⋯   , η 1 s , η 2 s , ⋯   , η t s s \eta_{11},\eta_{21},\cdots,\eta_{t_11},\eta_{12},\eta_{22},\cdots,\eta_{t_22},\cdots,\eta_{1s},\eta_{2s},\cdots,\eta_{t_ss} η11,η21,,ηt11,η12,η22,,ηt22,,η1s,η2s,,ηtss线性无关。(即判断大向量组的个数是否为n)

线性变换的可对角化的定理:设 V V V n n n维线性空间, f ∈ H o m ( V , V ) f\in Hom(V,V) fHom(V,V),则:

  1. f f f可对角化当且仅当 f f f n n n个线性无关的特征向量;
  2. f f f的属于不同特征值的特征向量线性无关;
  3. λ 1 , λ 2 , ⋯   , λ s \lambda_1,\lambda_2,\cdots,\lambda_s λ1,λ2,,λs f f f互不相同的特征值, η 1 i , η 2 i , ⋯   , η t i i \eta_{1i},\eta_{2i},\cdots,\eta_{t_i i} η1i,η2i,,ηtii f f f相应于特征值 λ i \lambda_i λi的线性无关的特征向量,则 η 11 , η 21 , ⋯   , η t 1 1 , η 12 , η 22 , ⋯   , η t 2 2 , ⋯   , η 1 s , η 2 s , ⋯   , η t s s \eta_{11},\eta_{21},\cdots,\eta_{t_11},\eta_{12},\eta_{22},\cdots,\eta_{t_22},\cdots,\eta_{1s},\eta_{2s},\cdots,\eta_{t_ss} η11,η21,,ηt11,η12,η22,,ηt22,,η1s,η2s,,ηtss线性无关。(即判断大向量组的个数是否为n)

特征子空间

特征子空间的定义:设 f ∈ H o m ( V , V ) f\in Hom(V,V) fHom(V,V) λ 0 \lambda_0 λ0 f f f的特征值,称 V λ 0 = { η ∈ V ∣ f ( η ) = λ 0 η } V_{\lambda_0}=\{\eta\in V|f(\eta)=\lambda_0\eta\} Vλ0={ηVf(η)=λ0η} f f f相应于特征值 λ 0 \lambda_0 λ0的特征子空间。(即属于 λ 0 \lambda_0 λ0的特征向量的集合)

  1. f f f在相应于特征值 λ 0 \lambda_0 λ0的线性无关的特征相关个数为 dim ⁡ V λ 0 \dim V_{\lambda_0} dimVλ0
  2. λ 1 , λ 2 , ⋯   , λ s \lambda_1,\lambda_2,\cdots,\lambda_s λ1,λ2,,λs f f f的相异特征值,则和 V λ 1 + V λ 2 + ⋯ + V λ s V_{\lambda_1}+V_{\lambda_2}+\cdots+V_{\lambda_s} Vλ1+Vλ2++Vλs是直和;
  3. f ∈ H o m ( V , V ) f\in Hom(V,V) fHom(V,V)的特征多项式是 C ( λ ) = ∏ i = 1 s ( λ − λ i ) c i C(\lambda)=\prod_{i=1}^s(\lambda-\lambda_i)^{c_i} C(λ)=i=1s(λλi)ci,则 dim ⁡ V λ i ≤ c i \dim V_{\lambda_i}\leq c_i dimVλici。(即特征值的代数重数大于等于特征值的几何重数)

可对角化等价条件:设 f ∈ H o m ( V , V ) f\in Hom(V,V) fHom(V,V)的特征多项式是 C ( λ ) = ∏ i = 1 s ( λ − λ i ) c i C(\lambda)=\prod_{i=1}^s(\lambda-\lambda_i)^{c_i} C(λ)=i=1s(λλi)ci

  1. f f f是可对角化的;
  2. dim ⁡ V λ 1 + dim ⁡ V λ 2 + ⋯ + dim ⁡ V λ s = n \dim V_{\lambda_1}+\dim V_{\lambda_2}+\cdots+\dim V_{\lambda_s}=n dimVλ1+dimVλ2++dimVλs=n;
  3. ∀ i , dim ⁡ V λ i = c i \forall i, \dim V_{\lambda_i}=c_i i,dimVλi=ci;
  4. V = V λ 1 ⊕ V λ 2 ⊕ ⋯ ⊕ V λ s V=V_{\lambda_1}\oplus V_{\lambda_2}\oplus\cdots\oplus V_{\lambda_s} V=Vλ1Vλ2Vλs

最小多项式与可对角化

n n n阶矩阵 M i M_i Mi满足 M 1 , M 2 , ⋯   , M s = O M_1,M_2,\cdots,M_s=O M1,M2,,Ms=O,则 ∑ i = 1 s r ( M i ) ≤ ( s − 1 ) n \sum_{i=1}^sr(M_i)\leq(s-1)n i=1sr(Mi)(s1)n

可对角化的条件: n n n阶矩阵 A A A相似于对角阵当且仅当 A A A最小多项式无重根

3 若当标准形

Jordan型矩阵定义:

  1. 形如 ( a 1 a ⋱ ⋱ 1 a ) \begin{pmatrix}a&1& & \\ &a&\ddots& \\ & &\ddots&1\\ & & &a \end{pmatrix} a1a1a的矩阵称为Jordan块;
  2. 形如 J = ( J 1 J 2 ⋱ J s ) J=\begin{pmatrix}J_1 & & & \\ &J_2& & \\ & & \ddots& \\ & & & J_s \end{pmatrix} J=J1J2Js,其中 J i J_i Ji是Jordan块的矩阵称为 J o r d a n Jordan Jordan型矩阵。

Jordan标准型的定义:若矩阵 A A A J J J相似,且 J J J是若当型矩阵,则称 J J J A A A的Jordan标准型。(Jordan标准型必存在)。

Jordan标准型的唯一性:除了相差Jordan块的次序外,每个矩阵的Jordan标准形是唯一的。

r ( J − λ 0 I ) k − 1 − r ( J − λ 0 I ) k r(J-\lambda_0I)^{k-1}-r(J-\lambda_0I)^{k} r(Jλ0I)k1r(Jλ0I)k J J J中以 λ 0 \lambda_0 λ0为主对角元且阶数 ≥ k \geq k k的Jordan块的块数。

求矩阵A的若当标准形:

  1. 求出矩阵A的特征多项式,并计算特征值
  2. 找出所有可能的Jordan标准形
  3. 计算 r ( A − λ i ) r(A-\lambda_i) r(Aλi)以排除不满足条件的Jordan标准形,

M = ( A O O B ) M=\begin{pmatrix}A&O\\O&B \end{pmatrix} M=(AOOB),则矩阵 M , A , B M,A,B M,A,B的最小多项式间有关系: m M ( λ ) = [ m A ( λ ) , m B ( λ ) ] m_M(\lambda)=[m_A(\lambda),m_B(\lambda)] mM(λ)=[mA(λ),mB(λ)](最小公倍式)。

设矩阵 A A A的最小多项式是 m ( λ ) = ∏ i = 1 s ( λ − λ i ) r i m(\lambda)=\prod_{i=1}^s(\lambda-\lambda_i)^{r_i} m(λ)=i=1s(λλi)ri,则 r i r_i ri即是 A A A的Jordan标准形中以 λ i \lambda_i λi为主对角元的Jordan块的最高阶数。当 A A A相似于对角阵时    ⟺    \iff A A A的最小多项式无重根。

A , B A,B A,B相似的充分必要条件是矩阵 A , B A,B A,B有相同的Jordan标准形。

参考文献:工程矩阵理论,张明淳著

;