一.幂零变换的约当标准形(9.7)
1.强循环子空间
(1)概念:
(2)将线性空间分解成强循环子空间:
定理1:设 B \mathcal{B} B是域 F F F上 r r r维线性空间 W W W上的幂零变换,其幂零指数为 l l l,则 W W W能分解成 d i m W 0 dim\,W_0 dimW0个 B − \mathcal{B}- B−强循环子空间的直和,其中 W 0 W_0 W0是 B \mathcal{B} B的属于特征值0的特征子空间
2.幂零变换的约当标准形:
定理2:设 B \mathcal{B} B是域 F F F上 r r r维线性空间 W W W上的幂零变换,其幂零指数为 l l l,则 W W W中存在1个基,使得 B \mathcal{B} B在此基下的矩阵 B B B为1个约当形矩阵,其中每个约当块的主对角元都是0,且级数不超过 l l l;约当块的总数等于 dim ( K e r B ) = r − r a n k ( B ) \dim(Ker\,\mathcal{B})=r-rank(\mathcal{B}) dim(KerB)=r−rank(B) t t t级约当块的个数 N ( t ) = r a n k ( B t + 1 ) + r a n k ( B t − 1 ) − 2 r a n k ( B t ) ( 7 ) N(t)=rank(\mathcal{B}^{t+1})+rank(\mathcal{B}^{t-1})-2rank(\mathcal{B}^t)\qquad(7) N(t)=rank(Bt+1)+rank(Bt−1)−2rank(Bt)(7)把 B B B称为 B \mathcal{B} B的约当标准形;除约当块的排列次序外, B \mathcal{B} B的约当标准形是唯一的
推论1:设 B B B是域 F F F上的 r r r级幂零矩阵,其幂零指数为 l l l,则 B B B相似于1个约当形矩阵,其中每个约当块的主对角元为0,且级数不超过 l l l,约当块的总数为 r − r a n k ( B ) ( 13 ) r-rank(B)\qquad(13) r−rank(B)(13) t t t级约当块的个数 N ( t ) = r a n k ( B t + 1 ) + r a n k ( B t − 1 ) − 2 r a n k ( B t ) ( 14 ) N(t)=rank(B^{t+1})+rank(B^{t-1})-2rank(B^t)\qquad(14) N(t)=rank(Bt+1)+rank(Bt−1)−2rank(Bt)(14)这个约当形矩阵称为 B B B的约当标准型;除去约当块的排列次序外, B B B的约当标准形是唯一的
二.线性变换的约当标准形(9.8)
1.线性变换的约当标准型
(1)线性变换的约当标准型:
定理3:设 A \mathcal{A} A是域 F F F上 n n n维线性空间 V V V上的线性变换,如果 A \mathcal{A} A的最小多项式 m ( λ ) m(λ) m(λ)在 F [ λ ] F[λ] F[λ]中的标准分解式为 m ( λ ) = ( λ − λ 1 ) l 1 ( λ − λ 2 ) l 2 . . . ( λ − λ s ) l s ( 1 ) m(λ)=(λ-λ_1)^{l_1}(λ-λ_2)^{l_2}...(λ-λ_s)^{l_s}\qquad(1) m(λ)=(λ−λ1)l1(λ−λ2)l2...(λ−λs)ls(1)那么 V V V中存在1个基,使得 A \mathcal{A} A在此基下的矩阵 A A A为约当形矩阵,其全部主对角元是 A \mathcal{A} A的全部特征值,特征值 λ j λ_j λj在主对角线上出现的次数等于 λ j λ_j λj的代数重数,主对角元为 λ j λ_j λj的约当块的总数 N j N_j Nj为 N j = n − r a n k ( A − λ j I ) ( 2 ) N_j=n-rank(\mathcal{A}-λ_j\mathcal{I})\qquad(2) Nj=n−rank(A−λjI)(2)其中 t t t级约当块 J t ( λ j ) J_t(λ_j) Jt(λj)的个数 N j ( t ) N_j(t) Nj(t)为 N j ( t ) = r a n k ( A − λ j I ) t + 1 + r a n k ( A − λ j I ) t − 1 − 2 r a n k ( A − λ j I ) t ( 3 ) N_j(t)=rank(\mathcal{A}-λ_j\mathcal{I})^{t+1}+rank(\mathcal{A}-λ_j\mathcal{I})^{t-1}-2rank(\mathcal{A}-λ_j\mathcal{I})^t\qquad(3) Nj(t)=rank(A−λjI)t+1+rank(A−λjI)t−1−2rank(A−λjI)t(3)其中 1 ≤ t ≤ l j ( j = 1 , 2... s ) 1≤t≤l_j\,(j=1,2...s) 1≤t≤lj(j=1,2...s);这个约当形矩阵 A A A称为 A \mathcal{A} A的约当标准形;除去约当块的排列次序外, A \mathcal{A} A的约当标准形是唯一的
(2)矩阵的约当标准型:
(定理3的)推论1:设 A A A是域 F F F上的 n n n级矩阵,如果 A A A的最小多项式 m ( λ ) m(λ) m(λ)在 F [ λ ] F[λ] F[λ]中的标准分解式为 m ( λ ) = ( λ − λ 1 ) l 1 ( λ − λ 2 ) l 2 . . . ( λ − λ s ) l s ( 10 ) m(λ)=(λ-λ_1)^{l_1}(λ-λ_2)^{l_2}...(λ-λ_s)^{l_s}\qquad(10) m(λ)=(λ−λ1)l1(λ−λ2)l2...(λ−λs)ls(10)那么 A A A相似于1个约当形矩阵,该约当形矩阵的全部主对角元是 A A A的全部特征值,特征值 λ j λ_j λj在主对角线上出现的次数等于 λ j λ_j λj的代数重数,主对角元为 λ j λ_j λj的约当块的总数 N j N_j Nj为 N j = n − r a n k ( A − λ j I ) ( 11 ) N_j=n-rank(A-λ_jI)\qquad(11) Nj=n−rank(A−λjI)(11)其中 t t t级约当块 J t ( λ j ) J_t(λ_j) Jt(λj)的个数 N j ( t ) N_j(t) Nj(t)为 N j ( t ) = r a n k ( A − λ j I ) t + 1 + r a n k ( A − λ j I ) t − 1 − 2 r a n k ( A − λ j I ) t ( 12 ) N_j(t)=rank(A-λ_jI)^{t+1}+rank(A-λ_jI)^{t-1}-2rank(A-λ_jI)^t\qquad(12) Nj(t)=rank(A−λjI)t+1+rank(A−λjI)t−1−2rank(A−λjI)t(12)其中 1 ≤ t ≤ l j ( j = 1 , 2... s ) 1≤t≤l_j\,(j=1,2...s) 1≤t≤lj(j=1,2...s);这个约当形矩阵 A A A称为 A A A的约当标准形;除去约当块的排列次序外, A A A的约当标准形是唯一的
(3)线性变换和矩阵有约当标准型的充要条件:
(定理3的)推论2:域 F F F上 n n n维线性空间 V V V上的线性变换 A \mathcal{A} A有约当标准形当且仅当 A \mathcal{A} A的最小多项式 m ( λ ) m(λ) m(λ)在 F [ λ ] F[λ] F[λ]中可分解成1次因式的乘积
(定理3的)推论3:域 F F F上 n n n维线性空间 V V V上的线性变换 A \mathcal{A} A有约当标准形当且仅当 A \mathcal{A} A的特征多项式 f ( λ ) f(λ) f(λ)在 F [ λ ] F[λ] F[λ]中可分解成1次因式的乘积
(定理3的)推论4:域 F F F上的 n n n级矩阵 A A A相似于1个约当形矩阵当且仅当 A A A的最小多项式 m ( λ ) m(λ) m(λ)(或特征多项式 f ( λ ) f(λ) f(λ))在 F [ λ ] F[λ] F[λ]中可分解成1次因式的乘积
2.初等因子与相似矩阵
(1)定义:
(2)矩阵相似的充要条件:
(定理3的)推论5:设 A , B ∈ M n ( F ) A,B∈M_n(F) A,B∈Mn(F),如果 A , B A,B A,B都有约当标准形,那么 A A A与 B B B相似当且仅当它们有相同的初等因子
注:①本行也是矩阵相似的充要条件,也可使用本条件
(定理3的)推论6:2个 n n n级复矩阵相似当且仅当它们有相同的初等因子
3.空间分解的方法:
4.约当基
(1)定义:
(2)求解:
三.相抵标准形(9.8)
1.相抵标准形
(1)定义:
定理4:任意1个非零的 n n n级 λ − λ- λ−矩阵 A ( λ ) A(λ) A(λ)一定相抵于对角 λ − λ− λ−矩阵: d i a g { d 1 ( λ ) , d 2 ( λ ) . . . d n ( λ ) } ( 1 ) diag\,\{d_1(λ),d_2(λ)...d_n(λ)\}\qquad(1) diag{d1(λ),d2(λ)...dn(λ)}(1)其中 d i ( λ ) ∣ d i + 1 ( λ ) ( i = 1 , 2... n − 1 ) d_i(λ)\,|\,d_{i+1}(λ)\,(i=1,2...n-1) di(λ)∣di+1(λ)(i=1,2...n−1);且对于任意1个非零的 d i ( λ ) d_i(λ) di(λ),其首项系数为1.满足这些要求的对角 λ − λ− λ−矩阵 ( 1 ) (1) (1)称为 A ( λ ) A(λ) A(λ)的1个相抵标准形或Smith标准形.将数域 K K K换成任一域 F F F,该定理仍成立
(2)不变因子与行列式因子:
定理5:相抵的 λ − λ− λ−矩阵有相同的秩和相同的各阶行列式因子
(3)唯一性:
(4)矩阵相抵的判定:
定理6:2个 n n n级 λ − λ- λ−矩阵相抵的充要条件是它们具有相同的不变因子或相同的各阶行列式因子
2.初等因子
(1)定义:
注意:这也就是 高等代数.线性映射(第9章)4.约当标准型.二.2 部分中定义1所定义的初等因子.今后把数域 K K K上 n n n级矩阵 A A A的特征矩阵 λ I − A λI-A λI−A的不变因子叫做 A A A的不变因子,把复矩阵 A A A的特征矩阵 λ I − A λI-A λI−A的初等因子叫做 A A A的初等因子
(2)矩阵相抵的判定:
定理7: C [ λ ] C[λ] C[λ]上2个满秩的 n n n级矩阵相抵的充要条件是它们有相同的初等因子
定理8:复数域上2个 n n n级矩阵的特征矩阵相抵的充要条件是它们具有相同的不变因子或相同的初等因子
(3)满秩矩阵的初等因子:
定理9:设 A ( λ ) A(λ) A(λ)是 C [ λ ] C[λ] C[λ]上的 n n n级满秩矩阵,通过初等变换把 A ( λ ) A(λ) A(λ)化成对角形,然后把主对角线上每个次数大于0的多项式都分解成互不相同的1次因式的乘积,则所有这些1次因式的方幂(相同的按出现次数计算)就是 A ( λ ) A(λ) A(λ)的初等因子
因此,对 C [ λ ] C[λ] C[λ]上的 n n n级满秩矩阵 A ( λ ) A(λ) A(λ),可直接求其初等因子,不需要先求不变因子
3.约当标准形
(1)矩阵相似的判定:
定理10:数域 K K K上2个 n n n级矩阵 A , B A,B A,B相似的充要条件是它们的特征矩阵 λ I − A , λ I − B λI-A,λI-B λI−A,λI−B相抵
定理11:数域 K K K上2个 n n n级矩阵 A , B A,B A,B相似的充要条件是它们有相同的不变因子.2个 n n n级复矩阵相似的充要条件是它们有相同的不变因子或相同的初等因子
(2)约当标准形:
定理12:任意1个 n n n级复矩阵 A A A都与1个约当形矩阵相似,该约当形矩阵除去其中约当块的排列次序外被 A A A唯一决定,称其为 A A A的约当标准形
(定理12的)推论1: n n n级复矩阵 A A A的最小多项式 m ( λ ) m(λ) m(λ)等于 A A A的最后1个不变因子 d n ( λ ) d_n(λ) dn(λ)
(定理12的)推论2:数域 K K K上 n n n级矩阵 A A A的最小多项式 m ( λ ) m(λ) m(λ)等于 A A A的最后1个不变因子 d n ( λ ) d_n(λ) dn(λ)
由 ( 14 ) (14) (14),数域 K K K上 n n n级矩阵 A A A的特征多项式 f ( λ ) = D n ( λ ) = ∏ i = 1 n d i ( λ ) f(λ)=D_n(λ)=\displaystyle\prod_{i=1}^nd_i(λ) f(λ)=Dn(λ)=i=1∏ndi(λ)
(定理12的)推论3:数域 K K K上 n n n级矩阵 A , B A,B A,B相似当且仅当把它们看成复矩阵后相似
在上述讨论中,把数域 K K K换成域 F F F,把复数域换成包含 F F F的代数封闭域,所有结论仍成立
附录1.定理10的证明
引理1:设 A A A是域 F F F上任一非零矩阵, G ( λ ) G(λ) G(λ)是任一 n n n级 λ − λ- λ−矩阵,则 ∃ n ∃n ∃n级 λ − λ- λ−矩阵 H 1 ( λ ) , H 2 ( λ ) H_1(λ),H_2(λ) H1(λ),H2(λ)和域 F F F上的 n n n级矩阵 T 1 , T 2 T_1,T_2 T1,T2,使得 G ( λ ) = H 1 ( λ ) ( λ I − A ) + T 1 ( 21 ) G ( λ ) = ( λ I − A ) H 2 ( λ ) + T 2 ( 22 ) G(λ)=H_1(λ)(λI-A)+T_1\qquad(21)\\G(λ)=(λI-A)H_2(λ)+T_2\qquad(22) G(λ)=H1(λ)(λI−A)+T1(21)G(λ)=(λI−A)H2(λ)+T2(22)
定理10’:域 F F F上2个 n n n级矩阵 A , B A,B A,B相似当且仅当 λ I − A , λ I − B λI-A,λI-B λI−A,λI−B相抵