Bootstrap

Jordan标准形知识梳理

λ-矩阵

链接

λ-矩阵的多项式展开

链接

Smith标准形

定义. 对于 n n n λ \lambda λ-矩阵 A ( λ ) \mathbf{A}(\lambda) A(λ), r a n k   A ( λ ) = r \mathrm{rank} \ \mathbf{A}(\lambda)=r rank A(λ)=r, 称 A ( λ ) \mathbf{A}(\lambda) A(λ) 的全部 1 ≤ k ≤ r 1 \leq k\leq r 1kr 阶子式的首1最大公因式为 A ( λ ) \mathbf{A}(λ) A(λ) k k k 阶行列式因子, 记为 D k ( λ ) D_{k}(λ) Dk(λ).

定理. 对 λ \lambda λ-矩阵进行 λ \lambda λ-矩阵的初等变换不改变其各阶行列式因子.

证明: 对于 n n n λ \lambda λ-矩阵 A ( λ ) \mathbf{A}(\lambda) A(λ), r a n k   A ( λ ) = r \mathrm{rank}\ \mathbf{A}(\lambda)=r rank A(λ)=r, 证明对调行/列, 数乘行/列, 一行/列乘多项式加到另一行/列这三种初等变换操作均不改变其各阶行列式因子.

(1)对调行:设对调 A ( λ ) \mathbf{A}(\lambda) A(λ) i i i j j j 两行, 得到 A ′ ( λ ) \mathbf{A}'(\lambda) A(λ). 考虑 1 ≤ k ≤ r 1\leq k\leq r 1kr 阶子式 D ( i 1 , . . . , i k ; j 1 , . . . , j k ) D(i_1,...,i_k;j_1,...,j_k) D(i1,...,ik;j1,...,jk),(表示选取 i 1 , . . . , i k i_1,...,i_k i1,...,ik 行, j 1 , . . . , j k j_1,...,j_k j1,...,jk 列), 若 i 1 , . . . , i k i_1,...,i_k i1,...,ik 取值不包含 i , j i,j i,j, 则 D ′ ( i 1 , . . . , i k ; j 1 , . . . , j k ) = D ( i 1 , . . . , i k ; j 1 , . . . , j k ) D'(i_1,...,i_k;j_1,...,j_k)=D(i_1,...,i_k;j_1,...,j_k) D(i1,...,ik;j1,...,jk)=D(i1,...,ik;j1,...,jk), 若 i 1 , . . . , i k i_1,...,i_k i1,...,ik 取值同时包含 i , j i,j i,j, 则 D ′ ( i 1 , . . . , i k ; j 1 , . . . , j k ) = ( − 1 ) D ( i 1 , . . . , i k ; j 1 , . . . , j k ) D'(i_1,...,i_k;j_1,...,j_k)=(-1)D(i_1,...,i_k;j_1,...,j_k) D(i1,...,ik;j1,...,jk)=(1)D(i1,...,ik;j1,...,jk), 若 i 1 , . . . , i k i_1,...,i_k i1,...,ik 取值包含 i i i 而不包含 j j j, 设除 i , j i,j i,j 外其他行号为 s 1 , s 2 . . . , s k − 1 s_1, s_2...,s_{k-1} s1,s2...,sk1, 则 D ′ ( i , s 1 , . . . , s k − 1 ; j 1 , . . . , j k ) = ( − 1 ) D ( j , s 1 , . . . , s k − 1 ; j 1 , . . . , j k ) D'(i, s_1,...,s_{k-1};j_1,...,j_k)=(-1)D(j, s_1,...,s_{k-1};j_1,...,j_k) D(i,s1,...,sk1;j1,...,jk)=(1)D(j,s1,...,sk1;j1,...,jk), 同时 D ′ ( j , s 1 , . . . , s k − 1 ; j 1 , . . . , j k ) = ( − 1 ) D ( i , s 1 , . . . , s k − 1 ; j 1 , . . . , j k ) D'(j, s_1,...,s_{k-1};j_1,...,j_k)=(-1)D(i, s_1,...,s_{k-1};j_1,...,j_k) D(j,s1,...,sk1;j1,...,jk)=(1)D(i,s1,...,sk1;j1,...,jk), 即在忽略符号的前提下 D ( i , s 1 , . . . , s k − 1 ; j 1 , . . . , j k ) D(i, s_1,...,s_{k-1};j_1,...,j_k) D(i,s1,...,sk1;j1,...,jk) D ( j , s 1 , . . . , s k − 1 ; j 1 , . . . , j k ) D(j, s_1,...,s_{k-1};j_1,...,j_k) D(j,s1,...,sk1;j1,...,jk) 取值互换. 由此可知 A ( λ ) \mathbf{A}(\lambda) A(λ) k k k 阶行列式因子不变.
同理,对调列操作也不改变其各阶行列式因子.
(2)数乘行:设对 A ( λ ) \mathbf{A}(\lambda) A(λ) 的第 i i i 行数乘 k ≠ 0 k \neq 0 k=0, 得到 A ′ ( λ ) \mathbf{A}'(\lambda) A(λ). 考虑 1 ≤ k ≤ r 1\leq k\leq r 1kr 阶子式 D ( i 1 , . . . , i k ; j 1 , . . . , j k ) D(i_1,...,i_k;j_1,...,j_k) D(i1,...,ik;j1,...,jk),若 i 1 , . . . , i k i_1,...,i_k i1,...,ik 取值不包含 i i i, 则 D ′ ( i 1 , . . . , i k ; j 1 , . . . , j k ) = D ( i 1 , . . . , i k ; j 1 , . . . , j k ) D'(i_1,...,i_k;j_1,...,j_k)=D(i_1,...,i_k;j_1,...,j_k) D(i1,...,ik;j1,...,jk)=D(i1,...,ik;j1,...,jk), 若 i 1 , . . . , i k i_1,...,i_k i1,...,ik 取值包含 i i i, 则 D ′ ( i 1 , . . . , i k ; j 1 , . . . , j k ) = k D ( i 1 , . . . , i k ; j 1 , . . . , j k ) D'(i_1,...,i_k;j_1,...,j_k)=kD(i_1,...,i_k;j_1,...,j_k) D(i1,...,ik;j1,...,jk)=kD(i1,...,ik;j1,...,jk), 乘常数, 由此可知 A ( λ ) \mathbf{A}(\lambda) A(λ) k k k 阶行列式因子不变.
同理,数乘列操作也不改变其各阶行列式因子.
(3)一行乘多项式加到另一行:设对 A ( λ ) \mathbf{A}(\lambda) A(λ) 的第 j j j 行数乘多项式 ϕ ( λ ) \phi(\lambda) ϕ(λ) 加到第 i i i 行, 得到 A ′ ( λ ) \mathbf{A}'(\lambda) A(λ). 考虑 1 ≤ k ≤ r 1\leq k\leq r 1kr 阶子式 D ( i 1 , . . . , i k ; j 1 , . . . , j k ) D(i_1,...,i_k;j_1,...,j_k) D(i1,...,ik;j1,...,jk), 若 i 1 , . . . , i k i_1,...,i_k i1,...,ik 取值同时包含 i , j i,j i,j 或不包含 i i i, 则 D ′ ( i 1 , . . . , i k ; j 1 , . . . , j k ) = D ( i 1 , . . . , i k ; j 1 , . . . , j k ) D'(i_1,...,i_k;j_1,...,j_k)=D(i_1,...,i_k;j_1,...,j_k) D(i1,...,ik;j1,...,jk)=D(i1,...,ik;j1,...,jk), 若 i 1 , . . . , i k i_1,...,i_k i1,...,ik 取值包含 i i i 而不包含 j j j, 设除 i , j i,j i,j 外其他行号为 s 1 , s 2 . . . , s k − 1 s_1, s_2...,s_{k-1} s1,s2...,sk1, 则 D ′ ( i , s 1 , . . . , s k − 1 ; j 1 , . . . , j k ) = D ( i , s 1 , . . . , s k − 1 ; j 1 , . . . , j k ) + ( − 1 ) ϕ ( λ ) D ( j , s 1 , . . . , s k − 1 ; j 1 , . . . , j k ) D'(i, s_1,...,s_{k-1};j_1,...,j_k)=D(i, s_1,...,s_{k-1};j_1,...,j_k)+(-1)\phi(\lambda)D(j, s_1,...,s_{k-1};j_1,...,j_k) D(i,s1,...,sk1;j1,...,jk)=D(i,s1,...,sk1;j1,...,jk)+(1)ϕ(λ)D(j,s1,...,sk1;j1,...,jk), 设 A ( λ ) \mathbf{A}(\lambda) A(λ), A ′ ( λ ) \mathbf{A}'(\lambda) A(λ) k k k 阶行列式因子分别为 D k ′ ( λ ) D'_k(\lambda) Dk(λ), D k ′ ( λ ) D'_k(\lambda) Dk(λ), 则 D k ( λ ) ∣ D k ′ ( i , s 1 , . . . , s k − 1 ; j 1 , . . . , j k ) D_k(\lambda) | D'_{k}(i, s_1,...,s_{k-1};j_1,...,j_k) Dk(λ)Dk(i,s1,...,sk1;j1,...,jk), 因此 D k ( λ ) D_k(\lambda) Dk(λ) 整除所有 A ′ ( λ ) \mathbf{A}'(\lambda) A(λ) k k k 阶子式, D k ( λ ) ∣ D k ′ ( λ ) D_k(\lambda) | D'_{k}(\lambda) Dk(λ)Dk(λ). 初等变换是可逆的, 反过来, A ′ ( λ ) \mathbf{A}'(\lambda) A(λ) 的第 j j j 行数乘 − ϕ ( λ ) -\phi(\lambda) ϕ(λ) 加到第 i i i 行可得到 A ( λ ) \mathbf{A}(\lambda) A(λ), 同理可知 D k ′ ( λ ) ∣ D k ( λ ) D'_k(\lambda) | D_{k}(\lambda) Dk(λ)Dk(λ). 由此可知 A ( λ ) \mathbf{A}(\lambda) A(λ) k k k 阶行列式因子不变.
同理,一列乘多项式加到另一列不改变其各阶行列式因子.

因此对于 n n n λ \lambda λ-矩阵 A ( λ ) \mathbf{A}(\lambda) A(λ), r a n k   A ( λ ) = r \mathrm{rank}\ \mathbf{A} (\lambda)=r rank A(λ)=r, 初等变换不改变其各阶行列式因子.

这一定理还可以这样表述: 相抵的 λ \lambda λ-矩阵各阶行列式因子相同.

定理. 对于 n n n λ \lambda λ-矩阵 A ( λ ) \mathbf{A}(\lambda) A(λ), 存在唯一的 n n n λ \lambda λ-矩阵 S ( λ ) \mathbf{S}(\lambda) S(λ) 满足:

S ( λ ) = d i a g { d 1 ( λ ) , . . . , d r ( λ ) , 0 , . . . , 0 } ≃ A ( λ ) \mathbf{S}(\lambda)=\mathrm{diag} \{d_1(λ), ..., d_r(λ), 0, ..., 0\} \simeq \mathbf{A}(λ) S(λ)=diag{d1(λ),...,dr(λ),0,...,0}A(λ)

其中 d i ( λ ) d_i(λ) di(λ) 是首项系数为 1 1 1 的多项式,且 d i − 1 ( λ ) d_{i-1}(λ) di1(λ) 能整除 d i ( λ ) d_{i}(λ) di(λ), i = 2 , . . . , r i=2,...,r i=2,...,r.

证明:

存在性:

链接

唯一性:

证明: 下面证明 S ( λ ) \mathbf{S}(\lambda) S(λ) 满足如下性质:

(1) r = r a n k   S ( λ ) = r a n k   A ( λ ) r=\mathrm{rank}\ \mathbf{S}(\lambda)=\mathrm{rank}\ \mathbf{A}(\lambda) r=rank S(λ)=rank A(λ).

(2) A ( λ ) \mathbf{A}(\lambda) A(λ) 的各阶行列式因子 D 1 ( λ ) , . . . , D r ( λ ) D_1(\lambda),...,D_r(\lambda) D1(λ),...,Dr(λ) S ( λ ) \mathbf{S}(\lambda) S(λ) 的非零对角元 d 1 ( λ ) , . . . , d r ( λ ) d_1(\lambda),...,d_r(\lambda) d1(λ),...,dr(λ) 之间满足如下关系: D 1 ( λ ) = d 1 ( λ ) D_{1}(λ)=d_{1}(λ) D1(λ)=d1(λ); D 2 ( λ ) = d 1 ( λ ) d 2 ( λ ) D_{2}(λ)=d_{1}(λ)d_{2}(λ) D2(λ)=d1(λ)d2(λ), …, D r ( λ ) = d 1 ( λ ) d 2 ( λ ) . . . d r ( λ ) D_{r}(λ)=d_{1}(λ)d_{2}(λ)...d_{r}(λ) Dr(λ)=d1(λ)d2(λ)...dr(λ), 亦即:
d i ( λ ) = { D 1 ( λ )  if  i = 1 D i ( λ ) / D i − 1 ( λ )  if  2 ≤ i ≤ r d_{i}(\lambda)=\begin{cases} D_{1}(\lambda)& \text{ if } i=1 \\ D_{i}(\lambda)/D_{i-1}(\lambda) & \text{ if } 2 \leq i\leq r \end{cases} di(λ)={D1(λ)Di(λ)/Di1(λ) if i=1 if 2ir

(1)的证明: 初等变换不改变 λ \lambda λ-矩阵的秩, 因此 r a n k   S ( λ ) = r a n k   A ( λ ) = r \mathrm{rank}\ \mathbf{S}(\lambda)=\mathrm{rank}\ \mathbf{A}(\lambda)=r rank S(λ)=rank A(λ)=r.

(2)的证明:因为 S ( λ ) \mathbf{S}(\lambda) S(λ) A ( λ ) \mathbf{A}(λ) A(λ) 相抵, 因此具有相同的各阶行列式因子. 考虑 S ( λ ) \mathbf{S}(\lambda) S(λ) 1 ≤ k ≤ r 1\leq k\leq r 1kr 阶行列式因子: 选取第 1 1 1 ~ k k k 行第 1 1 1 ~ k k k 列的子式, 其值为 Π i = 1 k d i ( λ ) \Pi_{i=1}^{k}d_{i}(\lambda) Πi=1kdi(λ), 易证其必然可以整除 S ( λ ) \mathbf{S}(\lambda) S(λ) 其他 k k k 阶子式, 且首项系数为 1 1 1, 因此为所有 k k k 阶子式的首1最大公因式, 即 k k k 阶行列式因子, 因此 D k ( λ ) = Π i = 1 k d i ( λ ) D_{k}(\lambda)=\Pi_{i=1}^{k}d_{i}(\lambda) Dk(λ)=Πi=1kdi(λ).

若还存在一个相异的满足条件的 λ \lambda λ-矩阵 S ′ ( λ ) \mathbf{S}'(\lambda) S(λ), 则 S ′ ( λ ) \mathbf{S}'(\lambda) S(λ) S ( λ ) \mathbf{S}(\lambda) S(λ) 有相同的非零对角元个数和非零对角元取值, 进而 S ′ ( λ ) = S ( λ ) \mathbf{S}'(\lambda)=\mathbf{S}(\lambda) S(λ)=S(λ), 矛盾. 因此 S ( λ ) \mathbf{S}(\lambda) S(λ) 是唯一的满足此条件的矩阵.

可以得到上述结论(2)的一个推论: D k ( λ ) D_{k}(\lambda) Dk(λ) d k ( λ ) d_{k}(\lambda) dk(λ) 有相同的零点集(考虑多项式根的重复), 1 ≤ k ≤ r 1\leq k \leq r 1kr.

称上述的 S ( λ ) \mathbf{S}(\lambda) S(λ) A ( λ ) \mathbf{A}(\lambda) A(λ) 的Smith标准形. 称 d i ( λ ) d_i(\lambda) di(λ), 1 ≤ i ≤ n 1\leq i \leq n 1in A ( λ ) \mathbf{A}(\lambda) A(λ) 的第 i i i 个不变因子. 设 d r ( λ ) d_r(\lambda) dr(λ) 的零点集为 { λ j } j = 1 s \{\lambda_j\}_{j=1}^{s} {λj}j=1s, 则不变因子组可以表示成如下形式:

d 1 ( λ ) = ( λ − λ 1 ) e 11 . . . ( λ − λ s ) e 1 s d_{1}(λ)=(\lambda-\lambda_1)^{e_{11}}...(\lambda-\lambda_s)^{e_{1s}} d1(λ)=(λλ1)e11...(λλs)e1s
⋮ \vdots
d r ( λ ) = ( λ − λ 1 ) e r 1 . . . ( λ − λ s ) e r s d_{r}(λ)=(\lambda-\lambda_1)^{e_{r1}}...(\lambda-\lambda_s)^{e_{rs}} dr(λ)=(λλ1)er1...(λλs)ers

其中, 0 ≤ e 1 j ≤ e 2 j ≤ . . . ≤ e r j 0 \leq e_{1j} \leq e_{2j} \leq ... \leq e_{rj} 0e1je2j...erj, e r j ≠ 0 e_{rj} \neq 0 erj=0, j = 1 , . . . , s j=1,...,s j=1,...,s.

其中 d 1 ( λ ) d_1(\lambda) d1(λ) ~ d r ( λ ) d_r(\lambda) dr(λ) 的所有非零阶因子(不考虑重复), 即 ( λ − λ j ) e i j (\lambda-\lambda_j)^{e_{ij}} (λλj)eij, e i j ≠ 0 e_{ij}\neq 0 eij=0, i = 1 , . . . , r i=1,...,r i=1,...,r , j = 1 , . . . , s j=1,...,s j=1,...,s 统称为 A ( λ ) \mathbf{A}(\lambda) A(λ) 的初等因子.

Smith标准形, 不变因子, 初等因子, 各阶行列式因子已知其一可写出其他三个.

定理. 两个方阵有相同的Smith标准形    ⟺    \iff 有相同的不变因子    ⟺    \iff 有相同的初等因子    ⟺    \iff 有相同的各阶行列式因子.

定理. 方阵相抵    ⟺    \iff 有相同的Smith标准形.

证明: 若 A ( λ ) \mathbf{A}(λ) A(λ), B ( λ ) \mathbf{B}(λ) B(λ) 是相抵的方阵, 则由相抵的传递性, A ( λ ) \mathbf{A}(λ) A(λ) 相抵于 B ( λ ) \mathbf{B}(λ) B(λ) 的Smith标准形, 进而 B ( λ ) \mathbf{B}(λ) B(λ) 的Smith标准形也是 B ( λ ) \mathbf{B}(λ) B(λ) 的Smith标准形, 二者具有相同的Smith标准形. 反之, 由相抵的传递性可知, 有相同的Smith标准形的方阵是相抵的.

定理. 对于分块对角方阵 A ( λ ) = d i a g { A 1 ( λ ) , . . . , A r ( λ ) } \mathbf{A}(λ)=\mathrm{diag}\{\mathbf{A}_{1}(λ), ..., \mathbf{A}_{r}(λ)\} A(λ)=diag{A1(λ),...,Ar(λ)}, 其中每个分块均为方阵, A 1 ( λ ) , . . . , A r ( λ ) \mathbf{A}_{1}(λ), ..., \mathbf{A}_{r}(λ) A1(λ),...,Ar(λ) 的初等因子的并集构成 A ( λ ) \mathbf{A}(λ) A(λ) 的初等因子.

证明: 考虑有2个分块阵的情况: A ( λ ) = d i a g { A 1 ( λ ) , A 2 ( λ ) } \mathbf{A}(\lambda)=\mathrm{diag}\{\mathbf{A}_{1}(\lambda), \mathbf{A}_{2}(\lambda)\} A(λ)=diag{A1(λ),A2(λ)}. A 1 ( λ ) \mathbf{A}_{1}(\lambda) A1(λ) 的秩记为 r 1 r_{1} r1, A 2 ( λ ) \mathbf{A}_{2}(\lambda) A2(λ) 的秩记为 r 2 r_{2} r2, 分块阵的秩等于各块的秩之和, 因此 A ( λ ) \mathbf{A}(\lambda) A(λ) 的秩为 r 1 + r 2 r_1+r_2 r1+r2. A 1 ( λ ) , A 2 ( λ ) \mathbf{A}_{1}(\lambda), \mathbf{A}_{2}(\lambda) A1(λ),A2(λ) 的 Smith 标准形记为
A 1 ( λ ) ≃ [ d 1 ( 1 ) ( λ ) d 2 ( 1 ) ( λ ) ⋱ d r 1 ( 1 ) ( λ ) 0 ⋱ 0 ] N 1 × N 1 \mathbf{A}_{1}(\lambda) \simeq \begin{bmatrix} d^{(1)}_{1}(\lambda) & & & & & & & \\ & d^{(1)}_{2}(\lambda) & & & & & & \\ & & & \ddots & & & & \\ & & & &d_{r_{1}}^{(1)}(\lambda) & & & \\ & & & & & 0 & & \\ & & & & & & \ddots & \\ & & & & & & & 0 \end{bmatrix}_{N_{1}\times N_{1}} A1(λ) d1(1)(λ)d2(1)(λ)dr1(1)(λ)00 N1×N1

A 2 ( λ ) ≃ [ d 1 ( 2 ) ( λ ) d 2 ( 2 ) ( λ ) ⋱ d r 2 ( 2 ) ( λ ) 0 ⋱ 0 ] N 2 × N 2 \mathbf{A}_{2}(\lambda) \simeq \begin{bmatrix} d^{(2)}_{1}(\lambda) & & & & & && \\ & d^{(2)}_{2}(\lambda) & & & & && \\ & & & \ddots & & && \\ & & & &d_{r_{2}}^{(2)}(\lambda) & && \\ & & & & & 0 & & \\ & & & & & & \ddots& \\ & & & & & & & 0 \end{bmatrix}_{N_{2}\times N_{2}} A2(λ) d1(2)(λ)d2(2)(λ)dr2(2)(λ)00 N2×N2

A ( λ ) ≃ [ A 1 ( λ ) A 2 ( λ ) 0 ] ( N 1 + N 2 ) × ( N 1 + N 2 ) = [ d 1 ( 1 ) ( λ ) ⋱ d r 1 ( 1 ) ( λ ) d 1 ( 2 ) ( λ ) ⋱ d r 2 ( 2 ) ( λ ) 0 ⋱ 0 ] ( N 1 + N 2 ) × ( N 1 + N 2 ) ≡ K A ( λ ) \mathbf{A}(\lambda) \simeq \begin{bmatrix} \mathbf{A}_1(\lambda)& &\\ &\mathbf{A}_2 (\lambda)&\\ && \mathbf{0} \end{bmatrix}_{(N_{1}+N_{2})\times (N_{1}+N_{2})}= \begin{bmatrix} d^{(1)}_{1}(\lambda) & & & & & & & &\\ & \ddots & & & & & & &\\ & & & d_{r_{1}}^{(1)}(\lambda) & & & & & &\\ & & & &d_{1}^{(2)}(\lambda) & & & & &\\ & & & & & \ddots & & & &\\ & & & & & & d_{r_{2}}^{(2)}(\lambda) & & &\\ & & & & & & & 0 & &\\ & & & & & & & & \ddots &\\ & & & & & & & & & 0 \end{bmatrix}_{(N_{1}+N_{2})\times (N_{1}+N_{2})} \equiv \mathbf{K}_{\mathbf{A}}(\lambda) A(λ) A1(λ)A2(λ)0 (N1+N2)×(N1+N2)= d1(1)(λ)dr1(1)(λ)d1(2)(λ)dr2(2)(λ)00 (N1+N2)×(N1+N2)KA(λ)
A \mathbf{A} A 的 Smith 标准形记为
S A ( λ ) = [ d 1 ( λ ) d 2 ( λ ) ⋱ d r ( λ ) 0 ⋱ 0 ] ( N 1 + N 2 ) × ( N 1 + N 2 ) \mathbf{S}_{\mathbf{A}} (\lambda) = \begin{bmatrix} d_{1}(\lambda) & & & & & & &\\ & d_{2}(\lambda) & & & & & &\\ & & & \ddots & & & &\\ & & & &d_{r}(\lambda) & & &\\ & & & & & 0 & &\\ & & & & & & \ddots &\\ & & & & & & &0 \end{bmatrix}_{(N_{1}+N_{2})\times (N_{1}+N_{2})} SA(λ)= d1(λ)d2(λ)dr(λ)00 (N1+N2)×(N1+N2)

其中 r = r 1 + r 2 r=r_{1}+r_{2} r=r1+r2

A 1 ( λ ) , A 2 ( λ ) \mathbf{A}_{1}(\lambda), \mathbf{A}_{2}(\lambda) A1(λ),A2(λ) 所有初等因子都是 A ( λ ) \mathbf{A}(\lambda) A(λ) 的初等因子: 设 A 1 ( λ ) , A 2 ( λ ) \mathbf{A}_{1}(\lambda), \mathbf{A}_{2}(\lambda) A1(λ),A2(λ) 的初等因子的根构成的集合是 { λ i } i = 1 s \{\lambda_{i}\}_{i=1}^{s} {λi}i=1s. 对于 λ i \lambda_i λi, 1 ≤ i ≤ s 1\leq i \leq s 1is, 分别对 d 1 ( 1 ) ( λ ) , … , d r 1 ( 1 ) ( λ ) , d 1 ( 2 ) ( λ ) , … , d r 2 ( 2 ) ( λ ) d_{1}^{(1)}(\lambda),\dots, d_{r_1}^{(1)}(\lambda),d_{1}^{(2)}(\lambda),\dots, d_{r_2}^{(2)}(\lambda) d1(1)(λ),,dr1(1)(λ),d1(2)(λ),,dr2(2)(λ) ( λ − λ i ) (\lambda-\lambda_{i}) (λλi) 的次数按照由低到高进行排序(若不含此项则次数记为 0 0 0), 记排序结果为 c i 1 ≤ ⋯ ≤ c i r c_{i1}\leq \dots\leq c_{ir} ci1cir. 相抵的矩阵具有相同的各阶行列式因子, 因此 A ( λ ) \mathbf{A}(\lambda) A(λ) 的各阶行列式因子等于 K A ( λ ) \mathbf{K}_{\mathbf{A}}(\lambda) KA(λ) 的各阶行列式因子, 考虑 A ( λ ) \mathbf{A}(\lambda) A(λ) k k k 阶行列式因子 D k ( λ ) D_{k}(\lambda) Dk(λ), 1 ≤ k ≤ r 1 \leq k \leq r 1kr, 其等于 K A ( λ ) \mathbf{K}_{\mathbf{A}}(\lambda) KA(λ) k k k 阶行列式因子, 显然 K A ( λ ) \mathbf{K}_{\mathbf{A}}(\lambda) KA(λ) k k k 阶行列式因子中 ( λ − λ i ) (\lambda-\lambda_{i}) (λλi) 的次数为 ∑ s = 1 k c i s \sum\limits_{s=1}^{k}c_{is} s=1kcis, 因此 d 1 ( λ ) , . . . , d r ( λ ) d_{1}(\lambda),...,d_{r}(\lambda) d1(λ),...,dr(λ) ( λ − λ i ) (\lambda-\lambda_{i}) (λλi) 的次数分别为 c i 1 , … , c i r c_{i1}, \dots , c_{ir} ci1,,cir, 因此 A 1 ( λ ) , A 2 ( λ ) \mathbf{A}_{1}(\lambda), \mathbf{A}_{2}(\lambda) A1(λ),A2(λ) ( λ − λ i ) (\lambda-\lambda_{i}) (λλi) 幂次形式的初等因子都是 A ( λ ) \mathbf{A}(\lambda) A(λ) 的初等因子.

A ( λ ) \mathbf{A}(\lambda) A(λ) 不会有除 A 1 ( λ ) , A 2 ( λ ) \mathbf{A}_{1}(\lambda), \mathbf{A}_{2}(\lambda) A1(λ),A2(λ) 的初等因子外的其他初等因子: 由相抵关系的传递性可知 K A ( λ ) ≃ S A ( λ ) \mathbf{K}_{\mathbf{A}}(\lambda) \simeq \mathbf{S}_{\mathbf{A}}(\lambda) KA(λ)SA(λ), 易证
[ d 1 ( 1 ) ( λ ) ⋱ d r 1 ( 1 ) ( λ ) d 1 ( 2 ) ( λ ) ⋱ d r 2 ( 2 ) ( λ )   ] ( r 1 + r 2 ) × ( r 1 + r 2 ) ≃ [ d 1 ( λ ) d 2 ( λ ) ⋱ d r ( λ ) ] ( r 1 + r 2 ) × ( r 1 + r 2 ) \begin{bmatrix} d^{(1)}_{1} (\lambda)& & & & & & \\ & \ddots & & & & & \\ & & & d_{r_{1}}^{(1)}(\lambda) & & & \\ & & & &d_{1}^{(2)}(\lambda) & & \\ & & & & & \ddots & \\ & & & & & & d_{r_{2}}^{(2)}(\lambda) \ \end{bmatrix}_{(r_{1}+r_{2})\times (r_{1}+r_{2})} \simeq \begin{bmatrix} d_{1}(\lambda) & & & & & \\ & d_2(\lambda) & & & & \\ & & & \ddots & & \\ & & & & & d_{r}(\lambda) \\ \end{bmatrix}_{(r_{1}+r_{2})\times (r_{1}+r_{2})} d1(1)(λ)dr1(1)(λ)d1(2)(λ)dr2(2)(λ)  (r1+r2)×(r1+r2) d1(λ)d2(λ)dr(λ) (r1+r2)×(r1+r2)
进而

∣ d 1 ( 1 ) ( λ ) ⋱ d r 1 ( 1 ) ( λ ) d 1 ( 2 ) ( λ ) ⋱ d r 2 ( 2 ) ( λ ) ∣ ( r 1 + r 2 ) × ( r 1 + r 2 ) = ∣ d 1 ( λ ) d 2 ( λ ) ⋱ d r ( λ ) ∣ ( r 1 + r 2 ) × ( r 1 + r 2 ) \begin{vmatrix} d^{(1)}_{1}(\lambda) & & & & & & \\ & \ddots & & & & & \\ & & & d_{r_{1}}^{(1)}(\lambda) & & & \\ & & & &d_{1}^{(2)}(\lambda) & & \\ & & & & & \ddots & \\ & & & & & & d_{r_{2}}^{(2)}(\lambda) \\ \end{vmatrix}_{(r_{1}+r_{2})\times (r_{1}+r_{2})} = \begin{vmatrix} d_{1}(\lambda) & & & & & \\ & d_2(\lambda) & & & & \\ & & & \ddots & & \\ & & & & & d_{r}(\lambda) \\ \end{vmatrix}_{(r_{1}+r_{2})\times (r_{1}+r_{2})} d1(1)(λ)dr1(1)(λ)d1(2)(λ)dr2(2)(λ) (r1+r2)×(r1+r2)= d1(λ)d2(λ)dr(λ) (r1+r2)×(r1+r2)

Π i = 1 r 1 d i ( 1 ) ( λ ) Π i = 1 r 2 d i ( 2 ) ( λ ) = Π i = 1 r d i ( λ ) \Pi_{i=1}^{r_1}d_{i}^{(1)}(\lambda)\Pi_{i=1}^{r_2}d_{i}^{(2)}(\lambda)=\Pi_{i=1}^{r}d_{i}(\lambda) Πi=1r1di(1)(λ)Πi=1r2di(2)(λ)=Πi=1rdi(λ)

A 1 ( λ ) , A 2 ( λ ) \mathbf{A}_{1}(\lambda),\mathbf{A}_{2}(\lambda) A1(λ),A2(λ) 的初等因子都是 A ( λ ) \mathbf{A}(\lambda) A(λ) 的初等因子, 因此 Π i = 1 r 1 d i ( 1 ) ( λ ) Π i = 1 r 2 d i ( 2 ) ( λ ) ≤ Π i = 1 r d i ( λ ) \Pi_{i=1}^{r_1}d_{i}^{(1)}(\lambda)\Pi_{i=1}^{r_2}d_{i}^{(2)}(\lambda)\leq \Pi_{i=1}^{r}d_{i}(\lambda) Πi=1r1di(1)(λ)Πi=1r2di(2)(λ)Πi=1rdi(λ), 若 A ( λ ) \mathbf{A}(\lambda) A(λ) 含有除此以外的其他初等因子, 则必然 Π i = 1 r 1 d i ( 1 ) ( λ ) Π i = 1 r 2 d i ( 2 ) ( λ ) < Π i = 1 r d i ( λ ) \Pi_{i=1}^{r_1}d_{i}^{(1)}(\lambda)\Pi_{i=1}^{r_2}d_{i}^{(2)}(\lambda) < \Pi_{i=1}^{r}d_{i}(\lambda) Πi=1r1di(1)(λ)Πi=1r2di(2)(λ)<Πi=1rdi(λ), 矛盾.

反复利用分块个数为2时的结论可将结论推广至任意有限多个分块.

Jordan标准形

定义. n n n 阶数字矩阵 A \mathbf{A} A 的第 k k k ( 1 ≤ k ≤ r a n k   A 1\leq k \leq \mathrm{rank}\ \mathbf{A} 1krank A) 个不变因子, k k k 阶行列式因子与初等因子指特征矩阵 λ I − A λ\mathbf{I}-\mathbf{A} λIA 的第 k k k ( 1 ≤ k ≤ r a n k   A 1\leq k \leq \mathrm{rank}\ \mathbf{A} 1krank A) 个不变因子, k k k 阶行列式因子与初等因子.

由矩阵特征多项式的知识可知 ∣ λ I − A ∣ |\lambda \mathbf{I}-\mathbf{A}| λIA 为关于 λ \lambda λ n n n 次多项式, 且最高次项的系数为 1 1 1, 因此 λ I − A \lambda \mathbf{I}-\mathbf{A} λIA 是满秩(秩为 n n n)的 λ \lambda λ-矩阵, 进而可知其行列式因子的最高阶数为 n n n, 且第 n n n 阶行列式因子 D n ( λ ) = ∣ λ I − A ∣ D_{n}(\lambda)=|\lambda \mathbf{I}-\mathbf{A}| Dn(λ)=λIA, 有 k k k 个不变因子, 且第 n n n 个不变因子的根集就是矩阵的特征值集(考虑多项式根的重复), 重数不一定相同.

定理. A \mathbf{A} A, B \mathbf{B} B n n n λ \lambda λ-矩阵,则 A ∼ B \mathbf{A}\sim \mathbf{B} AB 的充要条件是 ( λ I − A ) (λ\mathbf{I}-\mathbf{A}) (λIA) ≃ \simeq ( λ I − B ) (λ\mathbf{I}-\mathbf{B}) (λIB).

该定理建立了数字矩阵相似和特征矩阵相抵的等价关系.

证明: 链接

定理. Jordan 块

J = [ λ 0 1 λ 0 1 ⋱ ⋱ λ 0 1 λ 0 ] r × r \mathbf{J}=\begin{bmatrix} \lambda_0 & 1 & & & \\ & \lambda_0 & 1 & & \\ & & \ddots & \ddots & \\ & & & \lambda_0 & 1\\ & & & & \lambda_0 \end{bmatrix}_{r \times r} J= λ01λ01λ01λ0 r×r

的不变因子为: d 1 ( λ ) = 1 d_1(\lambda)=1 d1(λ)=1, …, d r − 1 ( λ ) = 1 d_{r-1}(\lambda)=1 dr1(λ)=1, d r ( λ ) = ( λ − λ 0 ) r d_{r}(\lambda)=(\lambda-\lambda_0)^r dr(λ)=(λλ0)r.

证明: 注意到划去第 n n n 行第 1 1 1 列的子式

∣ 1 λ 0 1 ⋱ ⋱ λ 0 1 ∣ = 1 \begin{vmatrix} 1 & & & \\ \lambda_{0} &1 & & \\ & \ddots& \ddots & \\ & & \lambda_{0} & 1 \\ \end{vmatrix}=1 1λ01λ01 =1

因此 D n − 1 ( λ ) = 1 D_{n-1}( \lambda)=1 Dn1(λ)=1, D n ( λ ) = ∣ J ∣ = ( λ − λ 0 ) r D_{n}( \lambda)=|\mathbf{J}|=(\lambda-\lambda_0)^{r} Dn(λ)=J=(λλ0)r, 由此可知命题结论.

定理. 设 A \mathbf{A} A n n n λ \lambda λ-矩阵, 若 n n n 阶矩阵 J \mathbf{J} J 满足: J = d i a g { J 1 , . . . , J s } \mathbf{J}=\mathrm{diag}\{\mathbf{J}_1,...,\mathbf{J}_{s}\} J=diag{J1,...,Js}, 其中 J i \mathbf{J}_{i} Ji 是 Jordan 块
J i = [ λ i 1 λ i 1 ⋱ ⋱ λ i 1 λ i ] n i × n i \mathbf{J}_{i}=\begin{bmatrix} \lambda_i & 1 & & & \\ & \lambda_i & 1 & & \\ & & \ddots & \ddots & \\ & & & \lambda_i & 1\\ & & & & \lambda_i \end{bmatrix}_{n_i \times n_i} Ji= λi1λi1λi1λi ni×ni

( λ − λ i ) n i (\lambda-\lambda_i)^{n_i} (λλi)ni, i = 1 , . . . , s i=1,...,s i=1,...,s 构成 A \mathbf{A} A 的初等因子, 则 J \mathbf{J} J A \mathbf{A} A 相似, 称之为 A \mathbf{A} A 的一个 Jordan 标准形.

证明: 根据上一个定理, 易知 λ I − J \lambda \mathbf{I}-\mathbf{J} λIJ λ I − A \lambda\mathbf{I}-\mathbf{A} λIA 具有相同的初等因子, 因此 A \mathbf{A} A J \mathbf{J} J 相似.

如果不计 Jordan 块的排列顺序, 则 Jordan 标准形是唯一的.

定理. 相似矩阵具有相同的Jordan标准形(不计Jordan块的顺序).

证明: 对于相似两个矩阵, 二者具有相同的初等因子, 进而其Jordan标准形具有相同的Jordan块, 不计Jordan块的顺序的情况下可以认为它们具有相同的Jordan标准形.

定理. 若矩阵 A \mathbf{A} A 与一个Jordan 块构成的矩阵 d i a g { J 1 , . . . , J s } \mathrm{diag}\{\mathbf{J}_1,...,\mathbf{J}_{s}\} diag{J1,...,Js}, 其中 J i \mathbf{J}_i Ji 是 Jordan 块, i = 1 , . . . , s i=1,...,s i=1,...,s 相似, 则 J \mathbf{J} J A \mathbf{A} A 的一个 Jordan 标准形.

定理. A \mathbf{A} A n n n λ \lambda λ-矩阵,则 A \mathbf{A} A 可相似对角化的充要条件是的 A \mathbf{A} A 初等因子都是一次的.

证明: 必要性: A \mathbf{A} A 可对角化, 因此存在一个对角阵 Λ \Lambda Λ A \mathbf{A} A 相似. Λ \Lambda Λ 可以看成是由 n n n 个1阶Jordan块构成的Jordan矩阵, 因此 Λ \Lambda Λ 是其自身的一个Jordan标准形, 进而可知 Λ \Lambda Λ 的初等因子都是1次的. Λ ∼ A \Lambda \sim \mathbf{A} ΛA, 因此二者具有相同的初等因子, 进而 A \mathbf{A} A 的初等因子都是1次的. 充分性: 由 A \mathbf{A} A 的初等因子都是1次可知 A \mathbf{A} A 的Jordan标准形都是由1阶Jordan块构成的, 是一个对角阵, A \mathbf{A} A 相似于其 Jordan 标准形, 因此 A \mathbf{A} A 可对角化.

零化多项式与最小多项式

定义. 设 A \mathbf{A} A n n n 阶矩阵, 如果存在多项式 ϕ ( λ ) \phi(λ) ϕ(λ) 使得 ϕ ( A ) = 0 \phi(\mathbf{A})=\mathbf{0} ϕ(A)=0, 则称 ϕ ( λ ) \phi(λ) ϕ(λ) A \mathbf{A} A 的零化多项式.

定义. n n n 阶矩阵 A \mathbf{A} A 的所有零化多项式中,次数最低且首项系数为 1 1 1 的多项式称为 A \mathbf{A} A 的最小多项式,记为 m ( λ ) m(λ) m(λ).

定理. 设 ϕ ( λ ) \phi(λ) ϕ(λ) n n n 阶矩阵 A \mathbf{A} A 的零化多项式, m ( λ ) m(\lambda) m(λ) 是其最小多项式, 则 ϕ ( λ ) \phi(\lambda) ϕ(λ) m ( λ ) m(\lambda) m(λ) 的倍式, m ( λ ) m(\lambda) m(λ) ϕ ( λ ) \phi(\lambda) ϕ(λ) 的因式.

证明: 设 ϕ ( λ ) \phi(λ) ϕ(λ) 是零化多项式,则存在唯一的一组多项式 p ( λ ) p(\lambda) p(λ) r ( λ ) r(\lambda) r(λ), 使得 ϕ ( λ ) = p ( λ ) m ( λ ) + r ( λ ) \phi(λ) = p(λ)m(λ) + r(λ) ϕ(λ)=p(λ)m(λ)+r(λ) deg ⁡ r ( λ ) < deg ⁡ m ( λ ) \deg r(\lambda)< \deg m(\lambda) degr(λ)<degm(λ). ϕ ( A ) = m ( A ) = 0 \phi(\mathbf{A})=m(\mathbf{A})=\mathbf{0} ϕ(A)=m(A)=0, 因此 r ( A ) = 0 r(\mathbf{A})=\mathbf{0} r(A)=0, 若 r ( λ ) ≠ 0 r(\lambda) \neq 0 r(λ)=0, 则 r ( λ ) r(\lambda) r(λ) 是次数低于 m ( λ ) m(\lambda) m(λ) 的零化多项式, 这与 m ( λ ) m(\lambda) m(λ) 是最小多项式矛盾, 因此 r ( λ ) = 0 r(\lambda)=0 r(λ)=0. 由此可知, ϕ ( λ ) \phi(\lambda) ϕ(λ) m ( λ ) m(\lambda) m(λ) 的倍式, m ( λ ) m(\lambda) m(λ) ϕ ( λ ) \phi(\lambda) ϕ(λ) 的因式.

推论:最小多项式是唯一的.

证明: 若 m 1 ( λ ) ≠ m 2 ( λ ) m_1(\lambda)\neq m_2(\lambda) m1(λ)=m2(λ) 都是矩阵 A \mathbf{A} A 的最小多项式, 根据最小多项式的定义, 其必然是同次的. 令 Δ m ( λ ) = m 1 ( λ ) − m 2 ( λ ) \Delta m(\lambda)=m_1(\lambda)-m_2(\lambda) Δm(λ)=m1(λ)m2(λ), 因 m 1 ( λ ) m_1(\lambda) m1(λ), m 2 ( λ ) m_2(\lambda) m2(λ) 最高次项系数都为1, 因此相减后最高次项相消, deg ⁡ Δ m ( λ ) < deg ⁡ m 1 ( λ ) \deg \Delta m(\lambda) \lt \deg m_1(\lambda) degΔm(λ)<degm1(λ), 而 Δ m ( A ) = m 1 ( A ) − m 2 ( A ) = 0 \Delta m(\mathbf{A})=m_1(\mathbf{A})-m_2(\mathbf{A})=\mathbf{0} Δm(A)=m1(A)m2(A)=0, 因此 Δ m ( A ) \Delta m(\mathbf{A}) Δm(A) 也是 A \mathbf{A} A 的零化多项式且次数更低, 矛盾.

推论. (1) 所有零化多项式都是最小多项式的倍式, 最小多项式是所有零化多项式的因式.
(2) 一个多项式是零化多项式的充要条件是: 其是最小多项式的倍式/最小多项式是其因式.
(3) 一个多项式是最小多项式的充要条件是: 首项系数为1; 是零化多项式; 其所有首1的真因式(真因式是指不等于自身的因式)都不是零化多项式.

证明: (1), (2) 略. (3): 充分性: 设 f ( λ ) f(\lambda) f(λ) 满足所述条件. 由推论(1)可知, 最小多项式是 f ( λ ) f(\lambda) f(λ) 的因式. 最小多项式又不是 f ( λ ) f(\lambda) f(λ) 的真因式, 所以最小多项式必然是 f ( λ ) f(\lambda) f(λ). 必要性: 设 m ( λ ) m(\lambda) m(λ) 是最小多项式, 则 m ( λ ) m(\lambda) m(λ) 是首1的零化多项式, 若存在 m ( λ ) m(\lambda) m(λ) 的首1真因式 m ′ ( λ ) m'(\lambda) m(λ) 为零化多项式, 则 m ′ ( λ ) m'(\lambda) m(λ) 为次数更低的首1零化多项式, 这与 m ( λ ) m(\lambda) m(λ) 是最小多项式矛盾, 因此 m ( λ ) m(\lambda) m(λ) 的真因式都不是零化多项式.

定理. 分块矩阵 A = d i a g { A 1 , . . . , A s } \mathbf{A}=\mathrm{diag}\{\mathbf{A}_1, ..., \mathbf{A}_s\} A=diag{A1,...,As} (每个分块为方阵) 的最小多项式是 m 1 ( λ ) , . . . , m s ( λ ) m_{1}(λ),...,m_{s}(λ) m1(λ),...,ms(λ) 的首1最小公倍式, 其中 m 1 ( λ ) , . . . , m s ( λ ) m_{1}(λ),...,m_{s}(λ) m1(λ),...,ms(λ) 分别为 A 1 , . . . , A s \mathbf{A}_1, ..., \mathbf{A}_s A1,...,As 的最小多项式.

证明: 设多项式 ϕ ( λ ) \phi(\lambda) ϕ(λ) A \mathbf{A} A 的一个零化多项式, ϕ ( A ) = d i a g { ϕ ( A i ) } i = 1 s = 0 \phi(\mathbf{A})=\mathrm{diag} \{ \phi(\mathbf{A}_{i})\}_{i=1}^{s}=\mathbf{0} ϕ(A)=diag{ϕ(Ai)}i=1s=0, 因此 ϕ ( λ ) \phi(\lambda) ϕ(λ) A 1 , . . . , A s \mathbf{A}_{1},..., \mathbf{A}_{s} A1,...,As 的零化多项式, 进而可知 ϕ ( λ ) \phi(\lambda) ϕ(λ) m 1 ( λ ) , . . . , m s ( λ ) m_{1}(\lambda),..., m_{s}(\lambda) m1(λ),...,ms(λ) 的公倍式. 设 m 1 ( λ ) , . . . , m s ( λ ) m_{1}(λ),...,m_{s}(λ) m1(λ),...,ms(λ) 的最小公倍式为 f ( λ ) f(\lambda) f(λ), f ( A ) = d i a g { f ( A i ) } i = 1 s = 0 f(\mathbf{A})=\mathrm{diag} \{ f(\mathbf{A}_{i})\}_{i=1}^{s}=\mathbf{0} f(A)=diag{f(Ai)}i=1s=0, 因此 f ( λ ) f(\lambda) f(λ) A \mathbf{A} A 的零化多项式, 显然 A \mathbf{A} A 的所有零化多项式是 f ( λ ) f(\lambda) f(λ) 的倍式, 所以 f ( λ ) f(\lambda) f(λ) A \mathbf{A} A 的零化多项式中次数最低者, 且其首项系数为1, 因此其为 A \mathbf{A} A 的最小多项式.

定理. 相似矩阵有相同的最小多项式.

证明: 设 A ∼ B \mathbf{A} \sim \mathbf{B} AB, 则存在可逆阵 P \mathbf{P} P, 使得 P − 1 A P = B \mathbf{P}^{-1}\mathbf{A}\mathbf{P}=\mathbf{B} P1AP=B. 将 B \mathbf{B} B 代入 A \mathbf{A} A 的最小多项式 m A ( λ ) m_{A}(\lambda) mA(λ) 得:

m ( B ) = P − 1 m ( A ) P = 0 m(\mathbf{B})=\mathbf{P}^{-1}m(\mathbf{A})\mathbf{P}=\mathbf{0} m(B)=P1m(A)P=0

因此 m A ( λ ) m_{A}(\lambda) mA(λ) B \mathbf{B} B 的零化多项式, 同理, B \mathbf{B} B 的最小多项式 m B ( λ ) m_{B}(\lambda) mB(λ) 也是 A \mathbf{A} A 的零化多项式. 因此 m A ( λ ) m_{A}(\lambda) mA(λ), m B ( λ ) m_{B}(\lambda) mB(λ)互为彼此的因式, 必然相等.

Hamilton-Cayley定理. 设 A \mathbf{A} A n n n 阶矩阵, 则 A \mathbf{A} A 的特征多项式是 A \mathbf{A} A 的一个零化多项式.

证明:设 n n n 阶矩阵 A \mathbf{A} A 的特征多项式为 f ( λ ) = ∣ λ I − A ∣ f(\lambda)=|\lambda \mathbf{I} - \mathbf{A}| f(λ)=λIA. ( λ I − A ) ∗ (\lambda \mathbf{I}-\mathbf{A})^{*} (λIA) 的元素至多是 n − 1 n-1 n1 次多项式, 因此其可以表示为

( λ I − A ) ∗ = C n − 1 λ n − 1 + . . . + C 1 λ + C 0 (\lambda \mathbf{I}-\mathbf{A})^{*}=\mathbf{C}_{n-1}\lambda^{n-1}+...+\mathbf{C}_{1}\lambda + \mathbf{C}_{0} (λIA)=Cn1λn1+...+C1λ+C0

其中 C n − 1 , . . . , C 1 \mathbf{C}_{n-1}, ..., \mathbf{C}_{1} Cn1,...,C1 n n n 阶数字矩阵. 由伴随矩阵的性质可知

( λ I − A ) ( λ I − A ) ∗ = f ( λ ) I (\lambda \mathbf{I}-\mathbf{A})(\lambda \mathbf{I}-\mathbf{A})^{*}=f(\lambda)\mathbf{I} (λIA)(λIA)=f(λ)I

又设 f ( λ ) = a n λ n + . . . + a 1 λ + a 0 f(\lambda)=a_{n}\lambda^{n}+...+a_{1}\lambda+a_{0} f(λ)=anλn+...+a1λ+a0, 其中 a n = 1 a_n=1 an=1, 代入上式得

( λ I − A ) ( C n − 1 λ n − 1 + . . . + C 1 λ + C 0 ) = a n I λ n + . . . + a 0 I (\lambda \mathbf{I}-\mathbf{A})(\mathbf{C}_{n-1}\lambda^{n-1}+...+\mathbf{C}_{1}\lambda+\mathbf{C}_{0})=a_n \mathbf{I} \lambda^{n}+...+a_{0}\mathbf{I} (λIA)(Cn1λn1+...+C1λ+C0)=anIλn+...+a0I

等式左边整理得: C n − 1 λ n + ( C n − 2 − A C n − 1 ) λ n − 1 + . . . + ( C 2 − A C 1 ) λ − A C 0 \mathbf{C}_{n-1} \lambda^{n}+ (\mathbf{C}_{n-2}-\mathbf{A}\mathbf{C}_{n-1})\lambda^{n-1}+...+(\mathbf{C}_{2}-\mathbf{A}\mathbf{C}_{1})\lambda-\mathbf{A} \mathbf{C}_{0} Cn1λn+(Cn2ACn1)λn1+...+(C2AC1)λAC0

对比等式两边的系数可知

{ C n − 1 = I C n − 2 − A C n − 1 = a n − 1 I . . . C 2 − A C 1 = a 1 I − A C 0 = a 0 I \left\{\begin{matrix} \mathbf{C}_{n-1} &=\mathbf{I} \\ \mathbf{C}_{n-2}-\mathbf{A}\mathbf{C}_{n-1} &= a_{n-1}\mathbf{I} \\ ...\\ \mathbf{C}_{2}-\mathbf{A}\mathbf{C}_{1} &= a_{1}\mathbf{I} \\ -\mathbf{A}\mathbf{C}_{0} &=a_{0}\mathbf{I} \\ \end{matrix}\right. Cn1Cn2ACn1...C2AC1AC0=I=an1I=a1I=a0I

进而有

f ( A ) = a n A n + . . . + a 1 A + a 0 I = A n + ( C n − 2 − A C n − 1 ) A n − 1 + . . . + ( C 2 − A C 1 ) A − A C 0 = 0 f(\mathbf{A})=a_{n}\mathbf{A}^{n}+...+a_{1}\mathbf{A}+a_{0}\mathbf{I}= \mathbf{A}^{n}+(\mathbf{C}_{n-2}-\mathbf{A}\mathbf{C}_{n-1})\mathbf{A}^{n-1}+...+(\mathbf{C}_{2}-\mathbf{A}\mathbf{C}_{1})\mathbf{A}-\mathbf{A}\mathbf{C}_{0}=\mathbf{0} f(A)=anAn+...+a1A+a0I=An+(Cn2ACn1)An1+...+(C2AC1)AAC0=0

定理. Jordan块
J = [ a 1 a 1 ⋱ ⋱ a 1 a ] s × s \mathbf{J}=\begin{bmatrix} a & 1 & & & \\ & a & 1 & & \\ & & \ddots & \ddots & \\ & & & a & 1\\ & & & & a \end{bmatrix}_{s \times s} J= a1a1a1a s×s

的最小多项式为 J = ( λ − a ) s \mathbf{J}=(λ-a)^{s} J=(λa)s.

证明: Jordan块 J \mathbf{J} J 的特征多项式是 ( λ − a ) s (\lambda-a)^{s} (λa)s, 由于特征多项式是最小多项式的倍式, 因此最小多项式必然形如 ( λ − a ) k (\lambda-a)^{k} (λa)k, 其中 1 ≤ k ≤ s 1\leq k\leq s 1ks. 从 k = 1 k=1 k=1 开始试, 直至 ( J − a I ) k = 0 (\mathbf{J}-a\mathbf{I})^{k}=\mathbf{0} (JaI)k=0, 即可得出最小多项式. J − a I = [ 0 1 0 1 ⋱ ⋱ 0 1 0 ] s × s \mathbf{J}-a\mathbf{I}=\begin{bmatrix} 0 & 1 & & & \\ & 0 & 1 & & \\ & & \ddots & \ddots & \\ & & & 0 & 1\\ & & & & 0 \end{bmatrix}_{s \times s} JaI= 0101010 s×s

可以验证, 右乘这个矩阵相当于矩阵第 1 ∼ s − 1 1 \sim s-1 1s1 列整体向右移动一列, 第 1 1 1 列以全 0 0 0 填充, 因此直至 k = s k=s k=s 时才会得到 0 \mathbf{0} 0, 因此最小多项式是 ( λ − a ) s (λ-a)^{s} (λa)s.

定理. n n n λ \lambda λ-矩阵 A \mathbf{A} A 的最小多项式是 A \mathbf{A} A 的第 n n n 个不变因子.

证明: 设 J A \mathbf{J}_{\mathbf{A}} JA A \mathbf{A} A 的一个Jordan标准形, 则 A ∼ J A \mathbf{A} \sim \mathbf{J}_{\mathbf{A}} AJA, 进而 A \mathbf{A} A 的最小多项式是 J A \mathbf{J}_\mathbf{A} JA 的最小多项式. J A \mathbf{J}_\mathbf{A} JA 的最小多项式是其中所有Jordan块的最小多项式的首1最小公倍式. J A \mathbf{J}_\mathbf{A} JA 中每个Jordan块的最小多项式是 A \mathbf{A} A 的一个初等因子, 显然其首1的最小公倍式为 A \mathbf{A} A 的最后一个不变因子, 即第 n n n 个不变因子.

推论. 最小多项式是特征多项式的子式, 且与之具有相同的零点集.

定理. n n n λ \lambda λ-矩阵 A \mathbf{A} A 可相似对角化的充要条件是 m ( λ ) m(λ) m(λ) 无重零点.

证明: 必要性: A \mathbf{A} A 相似于对角阵的充要条件是初等因子都是1次的, 因此第 n n n 个不变因子 d n ( λ ) d_n(\lambda) dn(λ) 没有重零点, 而 m ( λ ) = d n ( λ ) m(λ)=d_n(\lambda) m(λ)=dn(λ), 因此 m ( λ ) m(λ) m(λ) 无重零点. 充分性: m ( λ ) m(\lambda) m(λ) 等于第 n n n 个不变因子, 因此不变因子没有重零点, 进而易知初等因子都是1次的, 因此 A \mathbf{A} A 可相似对角化.

习题

  1. 证明: n n n 阶矩阵 A \mathbf{A} A A T \mathbf{A}^T AT 相似.
  2. 证明: n n n 阶矩阵 A \mathbf{A} A 的秩为 r r r, 则 A \mathbf{A} A 的特征值中至少有 n − r n-r nr 0 0 0(不考虑重复).

2023年9月20日

2023年9月25日

2023年9月27日

2024年1月20日

2024年1月28日

2024年2月6日

2024年2月13日

2024年4月21日

;