第0章 复习与引申
第1章 线性空间与线性变换
第2章 内积空间和等距变换
第3章 矩阵的相似标准形
第4章 Hermite二次型
第5章 范数和矩阵函数
第6章 广义逆矩阵
第3章 矩阵的相似标准形
1 特征值与特征向量
矩阵的特征值和特征向量的定义:设 A A A是 n n n阶方阵, λ 0 \lambda_0 λ0是数,若存在 n n n维列向量 η \eta η,使得 η ≠ θ \eta\neq\theta η=θ,且 A η = λ 0 η A\eta=\lambda_0\eta Aη=λ0η,则称 λ 0 \lambda_0 λ0是 A A A的特征值, η \eta η是 A A A的属于特征值 λ 0 \lambda_0 λ0的特征向量。
矩阵的相似对角阵存在定理:设 A A A是 n n n阶方阵,则 A A A相似于对角阵的充分必要条件是 A A A有 n n n个线性无关向量。
**线性变换的特征值和特征向量的定义:**设 f f f是线性空间 V V V上的线性变换,设 λ 0 ∈ C \lambda_0\in C λ0∈C,若存在 η ∈ V \eta\in V η∈V使得 θ ≠ η ∈ V \theta\neq\eta\in V θ=η∈V且 f ( η ) = λ 0 η f(\eta)=\lambda_0\eta f(η)=λ0η,则称 λ 0 \lambda_0 λ0是线性变换 f f f的特征值, η \eta η是相应于 λ 0 \lambda_0 λ0的特征向量。
线性变换的可对角化定理:设 V V V是 n n n维线性空间, f f f是 V V V上的线性变换,则存在 V V V的基使得 f f f的矩阵是对角阵当且仅当 f f f有 n n n个线性无关的特征向量。
线性变换特征值和特征向量的计算:设
f
f
f在
V
V
V的基
α
1
,
⋯
,
α
n
\alpha_1,\cdots,\alpha_n
α1,⋯,αn下,若
λ
0
∈
C
,
η
∈
V
\lambda_0\in C, \eta\in V
λ0∈C,η∈V在基
α
1
,
⋯
,
α
n
\alpha_1,\cdots,\alpha_n
α1,⋯,αn下的坐标是
x
0
x_0
x0,则
f
(
η
)
f(\eta)
f(η)在基
α
1
,
⋯
,
α
n
\alpha_1,\cdots,\alpha_n
α1,⋯,αn下的坐标为
A
x
0
Ax_0
Ax0,所以:
f
(
η
)
=
λ
0
η
⟺
A
x
0
=
λ
0
x
0
f(\eta)=\lambda_0\eta\iff Ax_0=\lambda_0 x_0
f(η)=λ0η⟺Ax0=λ0x0
即:
η
\eta
η是
f
f
f属于特征值
λ
0
\lambda_0
λ0的特征向量当且仅当
x
0
x_0
x0是
A
A
A的属于特征值
λ
0
\lambda_0
λ0的特征向量。(
η
=
(
α
1
,
⋯
,
α
n
)
x
0
\eta=(\alpha_1,\cdots,\alpha_n)x_0
η=(α1,⋯,αn)x0)
矩阵相似定理:若 A , B ∈ C n × n A,B\in C^{n\times n} A,B∈Cn×n是相似的,则 ∣ λ I − A ∣ = ∣ λ I − B ∣ |\lambda I-A|=|\lambda I-B| ∣λI−A∣=∣λI−B∣;(逆命题不成立,可定义线性变换的特征多项式)。
特征多项式
特征多项式的定义:设 f f f在 V V V的基 α 1 , ⋯ , α n \alpha_1,\cdots,\alpha_n α1,⋯,αn下的矩阵为 A A A,则称 ∣ λ I − A ∣ |\lambda I- A| ∣λI−A∣为 f f f的特征多项式。(与基的选取无关,因为不同基下的矩阵相似,而相似矩阵的特征多项式相等)
k k k阶主子式的定义:设矩阵 A = ( a i j ) n × n , 1 ≤ i 1 ≤ i 2 ≤ ⋯ ≤ i k ≤ n A=(a_{ij})_{n\times n},1\leq i_1\leq i_2\leq\cdots\leq i_k\leq n A=(aij)n×n,1≤i1≤i2≤⋯≤ik≤n,则 A A A的第 i 1 , i 2 , ⋯ , i k i_1,i_2,\cdots,i_k i1,i2,⋯,ik行、第 i 1 , i 2 , ⋯ , i k i_1,i_2,\cdots,i_k i1,i2,⋯,ik列交叉处的元素构成的 k k k阶子式称为 A A A的 k k k阶主子式。
k k k阶子式( ( C n k ) 2 (C_n^k)^2 (Cnk)2个), k k k阶主子式( C n k C_n^k Cnk个), k k k阶顺序主子式(1个),
特征多项式的定理:设矩阵 A = ( a i j ) n × n A=(a_{ij})_{n\times n} A=(aij)n×n,则 ∣ λ I − A ∣ = λ n + b 1 λ n − 1 + b 2 λ n − 2 + ⋯ + b k λ n − k + ⋯ + b n − 1 λ + b n |\lambda I-A|=\lambda^n+b_1\lambda^{n-1}+b_2\lambda^{n-2}+\cdots+b_k\lambda^{n-k}+\cdots+b_{n-1}\lambda+b_n ∣λI−A∣=λn+b1λn−1+b2λn−2+⋯+bkλn−k+⋯+bn−1λ+bn,其中 b j = ( − 1 ) j ∑ ( A 的 所 有 j 阶 主 子 式 ) b_j=(-1)^j\sum(A的所有j阶主子式) bj=(−1)j∑(A的所有j阶主子式),特别的, b 1 = − ∑ i n a i i , b n = ( − 1 ) n ∣ A ∣ b_1=-\sum_{i}^na_{ii},b_n=(-1)^n|A| b1=−∑inaii,bn=(−1)n∣A∣。
矩阵的迹的定义:设矩阵 A = ( a i j ) n × n A=(a_{ij})_{n\times n} A=(aij)n×n,称 ∑ i n a i i \sum_{i}^na_{ii} ∑inaii为矩阵的迹,记为 t r ( A ) tr(A) tr(A)。
- 若 A = ( a i j ) n × n A=(a_{ij})_{n\times n} A=(aij)n×n的特征值为 λ 1 , ⋯ , λ n \lambda_1,\cdots,\lambda_n λ1,⋯,λn,则 t r ( A ) = ∑ i = 1 n λ i , ∣ A ∣ = ∏ i = 1 n λ i tr(A)=\sum_{i=1}^n\lambda_i,|A|=\prod_{i=1}^n\lambda_i tr(A)=∑i=1nλi,∣A∣=∏i=1nλi。
- 若 A , B A,B A,B相似,则 t r ( A ) = t r ( B ) , ∣ A ∣ = ∣ B ∣ tr(A)=tr(B),|A|=|B| tr(A)=tr(B),∣A∣=∣B∣。( α β H \alpha\beta^H αβH的特征值计算,)
化零多项式的定义:设 f ( x ) f(x) f(x)是多项式,若 f ( A ) = 0 f(A)=0 f(A)=0,则 A A A的特征值均是 f ( x ) = 0 f(x)=0 f(x)=0的根。
Hamilton-Cayley定义
Schur引理:对于 ∀ A ∈ C n × n \forall A\in C^{n\times n} ∀A∈Cn×n,存在酉矩阵 U U U使得 U H A U U^HAU UHAU是上三角矩阵。
定理:设 A ∈ F n × n , C ( λ ) = ∣ λ I − A ∣ A\in F^{n\times n},C(\lambda)=|\lambda I-A| A∈Fn×n,C(λ)=∣λI−A∣,则 C ( A ) = 0 C(A)=0 C(A)=0。
定理:设 f ∈ H o m ( V , V ) , C ( λ ) f\in Hom(V,V),C(\lambda) f∈Hom(V,V),C(λ)是 f f f的特征多项式,则 C ( f ) = O C(f)=O C(f)=O。
例题:对于矩阵 A = ( 3 0 8 3 1 6 − 2 0 − 5 ) A=\begin{pmatrix} 3&0&8\\3&1&6\\-2&0&-5 \end{pmatrix} A=⎝⎛33−201086−5⎠⎞,求 A 100 − 2 A 50 A^{100}-2A^{50} A100−2A50。
计算出矩阵 A A A的特征多项式 C ( λ ) = ∣ λ I − A ∣ = ( λ − 1 ) ( λ + 1 ) 2 C(\lambda)=|\lambda I-A|=(\lambda-1)(\lambda+1)^2 C(λ)=∣λI−A∣=(λ−1)(λ+1)2;(特征值为1,-1二重)
构造函数 f ( λ ) = λ 100 − 2 λ 50 f(\lambda)=\lambda^{100}-2\lambda^{50} f(λ)=λ100−2λ50;
对函数做带余除法: f ( λ ) = C ( λ ) q ( λ ) + a λ 2 + b λ + c f(\lambda)=C(\lambda)q(\lambda)+a\lambda^2+b\lambda+c f(λ)=C(λ)q(λ)+aλ2+bλ+c;( f ( A ) = C ( A ) q ( A ) + a A 2 + b A + c = a A 2 + b A + c f(A)=C(A)q(A)+aA^2+bA+c=aA^2+bA+c f(A)=C(A)q(A)+aA2+bA+c=aA2+bA+c)
因此可以将特征值带入,得:
a + b + c = − 1 a − b + c = − 1 2 a − b = 0 ( 二 重 根 ) a+b+c=-1\\ a-b+c=-1\\ 2a-b=0(二重根) a+b+c=−1a−b+c=−12a−b=0(二重根)
矩阵的最小多项式
最小多项式的定义:矩阵 A A A的次数最低的、最高次项系数为一的化零多项式称为 A A A的最小多项式。
最小多项式的性质:
- 若 m ( x ) , φ ( x ) m(x),\varphi(x) m(x),φ(x)分别是矩阵 A A A的最小多项式和化零多项式,则 m ( x ) m(x) m(x)可以整除 φ ( x ) \varphi(x) φ(x),记为 m ( x ) ∣ φ ( x ) m(x)|\varphi(x) m(x)∣φ(x);
- 任意矩阵的最小多项式是唯一的;
- 如果矩阵 A , B A,B A,B相似,则 A , B A,B A,B有相同的最小多项式。
线性变换的最小多项式:设线性变换 f ∈ V f\in V f∈V在 V V V的一组基下的矩阵为 A A A, A A A的最小多项式称为 f f f的最小多项式。即线性变换 f f f的次数最低的、最高次项系数为1的化零多项式称为 f f f的最小多项式。
最小多项式定理:设 m ( x ) , C ( x ) m(x),C(x) m(x),C(x)分别是矩阵 A A A的最小多项式和特征多项式,则 m ( x ) ∣ C ( x ) m(x)|C(x) m(x)∣C(x),并且对于 λ 0 ∈ C , m ( λ 0 ) = 0 ⟺ C ( λ ) = 0 \lambda_0\in C,m(\lambda_0)=0\iff C(\lambda)=0 λ0∈C,m(λ0)=0⟺C(λ)=0。(求最小多项式:先求特征多项式,找出满足矩阵A的化零多项式,最小阶数的化零多项式为最小多项式)
2 可对角化问题
- 矩阵 A n × n A_{n\times n} An×n相似于对角阵 ⟺ \iff ⟺ A A A有 n n n个线性无关的特征向量;
- 矩阵属于不同特征值的特征向量线性无关
- 若 λ 1 , λ 2 , ⋯ , λ s \lambda_1,\lambda_2,\cdots,\lambda_s λ1,λ2,⋯,λs是矩阵 A A A的互不相同的特征值, η 1 i , η 2 i , ⋯ , η t i i \eta_{1i},\eta_{2i},\cdots,\eta_{t_i i} η1i,η2i,⋯,ηtii是 A A A相应于特征值 λ i \lambda_i λi的线性无关的特征向量,则 η 11 , η 21 , ⋯ , η t 1 1 , η 12 , η 22 , ⋯ , η t 2 2 , ⋯ , η 1 s , η 2 s , ⋯ , η t s s \eta_{11},\eta_{21},\cdots,\eta_{t_11},\eta_{12},\eta_{22},\cdots,\eta_{t_22},\cdots,\eta_{1s},\eta_{2s},\cdots,\eta_{t_ss} η11,η21,⋯,ηt11,η12,η22,⋯,ηt22,⋯,η1s,η2s,⋯,ηtss线性无关。(即判断大向量组的个数是否为n)
线性变换的可对角化的定理:设 V V V是 n n n维线性空间, f ∈ H o m ( V , V ) f\in Hom(V,V) f∈Hom(V,V),则:
- f f f可对角化当且仅当 f f f有 n n n个线性无关的特征向量;
- f f f的属于不同特征值的特征向量线性无关;
- 若 λ 1 , λ 2 , ⋯ , λ s \lambda_1,\lambda_2,\cdots,\lambda_s λ1,λ2,⋯,λs是 f f f互不相同的特征值, η 1 i , η 2 i , ⋯ , η t i i \eta_{1i},\eta_{2i},\cdots,\eta_{t_i i} η1i,η2i,⋯,ηtii是 f f f相应于特征值 λ i \lambda_i λi的线性无关的特征向量,则 η 11 , η 21 , ⋯ , η t 1 1 , η 12 , η 22 , ⋯ , η t 2 2 , ⋯ , η 1 s , η 2 s , ⋯ , η t s s \eta_{11},\eta_{21},\cdots,\eta_{t_11},\eta_{12},\eta_{22},\cdots,\eta_{t_22},\cdots,\eta_{1s},\eta_{2s},\cdots,\eta_{t_ss} η11,η21,⋯,ηt11,η12,η22,⋯,ηt22,⋯,η1s,η2s,⋯,ηtss线性无关。(即判断大向量组的个数是否为n)
特征子空间
特征子空间的定义:设 f ∈ H o m ( V , V ) f\in Hom(V,V) f∈Hom(V,V), λ 0 \lambda_0 λ0是 f f f的特征值,称 V λ 0 = { η ∈ V ∣ f ( η ) = λ 0 η } V_{\lambda_0}=\{\eta\in V|f(\eta)=\lambda_0\eta\} Vλ0={η∈V∣f(η)=λ0η}为 f f f相应于特征值 λ 0 \lambda_0 λ0的特征子空间。(即属于 λ 0 \lambda_0 λ0的特征向量的集合)
- f f f在相应于特征值 λ 0 \lambda_0 λ0的线性无关的特征相关个数为 dim V λ 0 \dim V_{\lambda_0} dimVλ0;
- 设 λ 1 , λ 2 , ⋯ , λ s \lambda_1,\lambda_2,\cdots,\lambda_s λ1,λ2,⋯,λs为 f f f的相异特征值,则和 V λ 1 + V λ 2 + ⋯ + V λ s V_{\lambda_1}+V_{\lambda_2}+\cdots+V_{\lambda_s} Vλ1+Vλ2+⋯+Vλs是直和;
- 设 f ∈ H o m ( V , V ) f\in Hom(V,V) f∈Hom(V,V)的特征多项式是 C ( λ ) = ∏ i = 1 s ( λ − λ i ) c i C(\lambda)=\prod_{i=1}^s(\lambda-\lambda_i)^{c_i} C(λ)=∏i=1s(λ−λi)ci,则 dim V λ i ≤ c i \dim V_{\lambda_i}\leq c_i dimVλi≤ci。(即特征值的代数重数大于等于特征值的几何重数)
可对角化等价条件:设 f ∈ H o m ( V , V ) f\in Hom(V,V) f∈Hom(V,V)的特征多项式是 C ( λ ) = ∏ i = 1 s ( λ − λ i ) c i C(\lambda)=\prod_{i=1}^s(\lambda-\lambda_i)^{c_i} C(λ)=∏i=1s(λ−λi)ci,
- f f f是可对角化的;
- dim V λ 1 + dim V λ 2 + ⋯ + dim V λ s = n \dim V_{\lambda_1}+\dim V_{\lambda_2}+\cdots+\dim V_{\lambda_s}=n dimVλ1+dimVλ2+⋯+dimVλs=n;
- ∀ i , dim V λ i = c i \forall i, \dim V_{\lambda_i}=c_i ∀i,dimVλi=ci;
- V = V λ 1 ⊕ V λ 2 ⊕ ⋯ ⊕ V λ s V=V_{\lambda_1}\oplus V_{\lambda_2}\oplus\cdots\oplus V_{\lambda_s} V=Vλ1⊕Vλ2⊕⋯⊕Vλs
最小多项式与可对角化
若 n n n阶矩阵 M i M_i Mi满足 M 1 , M 2 , ⋯ , M s = O M_1,M_2,\cdots,M_s=O M1,M2,⋯,Ms=O,则 ∑ i = 1 s r ( M i ) ≤ ( s − 1 ) n \sum_{i=1}^sr(M_i)\leq(s-1)n ∑i=1sr(Mi)≤(s−1)n。
可对角化的条件: n n n阶矩阵 A A A相似于对角阵当且仅当 A A A的最小多项式无重根。
3 若当标准形
Jordan型矩阵定义:
- 形如 ( a 1 a ⋱ ⋱ 1 a ) \begin{pmatrix}a&1& & \\ &a&\ddots& \\ & &\ddots&1\\ & & &a \end{pmatrix} ⎝⎜⎜⎛a1a⋱⋱1a⎠⎟⎟⎞的矩阵称为Jordan块;
- 形如 J = ( J 1 J 2 ⋱ J s ) J=\begin{pmatrix}J_1 & & & \\ &J_2& & \\ & & \ddots& \\ & & & J_s \end{pmatrix} J=⎝⎜⎜⎛J1J2⋱Js⎠⎟⎟⎞,其中 J i J_i Ji是Jordan块的矩阵称为 J o r d a n Jordan Jordan型矩阵。
Jordan标准型的定义:若矩阵 A A A与 J J J相似,且 J J J是若当型矩阵,则称 J J J是 A A A的Jordan标准型。(Jordan标准型必存在)。
Jordan标准型的唯一性:除了相差Jordan块的次序外,每个矩阵的Jordan标准形是唯一的。
r ( J − λ 0 I ) k − 1 − r ( J − λ 0 I ) k r(J-\lambda_0I)^{k-1}-r(J-\lambda_0I)^{k} r(J−λ0I)k−1−r(J−λ0I)k为 J J J中以 λ 0 \lambda_0 λ0为主对角元且阶数 ≥ k \geq k ≥k的Jordan块的块数。
求矩阵A的若当标准形:
- 求出矩阵A的特征多项式,并计算特征值
- 找出所有可能的Jordan标准形
- 计算 r ( A − λ i ) r(A-\lambda_i) r(A−λi)以排除不满足条件的Jordan标准形,
若 M = ( A O O B ) M=\begin{pmatrix}A&O\\O&B \end{pmatrix} M=(AOOB),则矩阵 M , A , B M,A,B M,A,B的最小多项式间有关系: m M ( λ ) = [ m A ( λ ) , m B ( λ ) ] m_M(\lambda)=[m_A(\lambda),m_B(\lambda)] mM(λ)=[mA(λ),mB(λ)](最小公倍式)。
设矩阵 A A A的最小多项式是 m ( λ ) = ∏ i = 1 s ( λ − λ i ) r i m(\lambda)=\prod_{i=1}^s(\lambda-\lambda_i)^{r_i} m(λ)=∏i=1s(λ−λi)ri,则 r i r_i ri即是 A A A的Jordan标准形中以 λ i \lambda_i λi为主对角元的Jordan块的最高阶数。当 A A A相似于对角阵时 ⟺ \iff ⟺ A A A的最小多项式无重根。
A , B A,B A,B相似的充分必要条件是矩阵 A , B A,B A,B有相同的Jordan标准形。
参考文献:工程矩阵理论,张明淳著