15.子空间投影
用途:用于在 A x ⃗ = b ⃗ A \vec{x} = \vec{b} Ax=b无解(即 b ⃗ \vec{b} b不属于 A A A的列空间)时,将 b ⃗ \vec{b} b投影至 A A A的列空间,从而得到一个最接近的解 x ⃗ ^ \widehat{\vec{x}} x
-
考虑向量投影至向量
设 p ⃗ = x a ⃗ \vec{p} = x \vec{a} p=xa因为 e ⃗ ⊥ a ⃗ \vec{e} \perp \vec{a} e⊥a,即 e ⃗ \vec{e} e与 a ⃗ \vec{a} a正交,所以 a ⃗ T e ⃗ = a ⃗ T ( b ⃗ − x a ⃗ ) = 0 \vec{a}^T \vec{e} = \vec{a}^T (\vec{b} - x \vec{a}) = 0 aTe=aT(b−xa)=0
化简得 a ⃗ T b ⃗ = a ⃗ T a ⃗ x \vec{a}^T \vec{b} = \vec{a}^T \vec{a} x aTb=aTax,,又 a ⃗ T a ⃗ \vec{a}^T \vec{a} aTa为一个常数,左右同除 a ⃗ T a ⃗ \vec{a}^T \vec{a} aTa得到 x = a ⃗ T b ⃗ a ⃗ T a ⃗ x = \dfrac{\vec{a}^T \vec{b}}{\vec{a}^T \vec{a}} x=aTaaTb
∴ p ⃗ = a ⃗ a ⃗ T b ⃗ a ⃗ T a ⃗ \therefore \vec{p} = \vec{a} \dfrac{\vec{a}^T \vec{b}}{\vec{a}^T \vec{a}} ∴p=aaTaaTb,其中 b ⃗ \vec{b} b翻倍则 p ⃗ \vec{p} p翻相同倍数, a ⃗ \vec{a} a翻倍则 p ⃗ \vec{p} p不变
由此可知对矩阵 b ⃗ \vec{b} b进行操作得到了 p ⃗ \vec{p} p
将操作所用矩阵(即用于生成投影的矩阵)称为投影矩阵,记作 P P P,那么 P = a ⃗ a ⃗ T a ⃗ T a ⃗ , p ⃗ = P b ⃗ P = \dfrac{\vec{a} \vec{a}^T}{\vec{a}^T \vec{a}} , \vec{p} = P \vec{b} P=aTaaaT,p=Pb
-
P P P的秩为 1 1 1( P P P中各行均为 a T a^T aT的倍数),且 P P P的列空间即为 a ⃗ \vec{a} a所在直线, a ⃗ \vec{a} a是 P P P的一个基
-
b ⃗ \vec{b} b与 a ⃗ \vec{a} a共线时, p ⃗ = b ⃗ \vec{p} = \vec{b} p=b
证明: ①图像说明
②设 b ⃗ = y a ⃗ \vec{b} = y \vec{a} b=ya, p ⃗ = P b ⃗ = y a ⃗ a ⃗ T a ⃗ T a ⃗ a ⃗ = y a ⃗ = b ⃗ \vec{p} = P \vec{b} = y \dfrac{\vec{a} \vec{a}^T}{\vec{a}^T \vec{a}} \vec{a} = y \vec{a} = \vec{b} p=Pb=yaTaaaTa=ya=b
-
P P P为对称矩阵
证明: P = a ⃗ a ⃗ T a ⃗ T a ⃗ P = \dfrac{\vec{a} \vec{a}^T}{\vec{a}^T \vec{a}} P=aTaaaT,而 a ⃗ a ⃗ T \vec{a} \vec{a}^T aaT为对称矩阵, a ⃗ T a ⃗ \vec{a}^T \vec{a} aTa为一个常数
-
P 2 = P P^2 = P P2=P
证明: ①用图像可说明 P P b ⃗ = P b ⃗ P P \vec{b} = P \vec{b} PPb=Pb从而得证
② P 2 = a ⃗ a ⃗ T a ⃗ T a ⃗ ⋅ a ⃗ a ⃗ T a ⃗ T a ⃗ = a ⃗ a ⃗ T a ⃗ a ⃗ T ( a ⃗ T a ⃗ ) 2 = a ⃗ a ⃗ T a ⃗ T a ⃗ = P P^2 = \dfrac{\vec{a} \vec{a}^T}{\vec{a}^T \vec{a}} \cdot \dfrac{\vec{a} \vec{a}^T}{\vec{a}^T \vec{a}} = \dfrac{\vec{a} \vec{a}^T \vec{a} \vec{a}^T }{(\vec{a}^T \vec{a})^2} = \dfrac{\vec{a} \vec{a}^T}{\vec{a}^T \vec{a}} = P P2=aTaaaT⋅aTaaaT=(aTa)2aaTaaT=aTaaaT=P
-
-
考虑向量投影至平面
设 { a ⃗ 1 , a ⃗ 2 } \{\vec{a}_1 , \vec{a}_2\} {a1,a2}为平面的一组基,该平面可表示为矩阵 A = [ a ⃗ 1 a ⃗ 2 ] A = \begin{bmatrix} \vec{a}_1 & \vec{a}_2 \end{bmatrix} A=[a1a2]的列空间, p ⃗ = x 1 a ⃗ 1 + x 2 a ⃗ 2 = A x ⃗ \vec{p} = x_1 \vec{a}_1 + x_2 \vec{a}_2 = A \vec{x} p=x1a1+x2a2=Ax因为 e ⃗ = b ⃗ − p ⃗ \vec{e} = \vec{b} - \vec{p} e=b−p垂直于平面,所以 e ⃗ ⊥ a ⃗ 1 , e ⃗ ⊥ a ⃗ 2 \vec{e} \perp \vec{a}_1 , \vec{e} \perp \vec{a}_2 e⊥a1,e⊥a2
∴ { a ⃗ 1 T ( b ⃗ − A x ⃗ ) = 0 a ⃗ 2 T ( b ⃗ − A x ⃗ ) = 0 \therefore \left\{\begin{matrix} \vec{a}_1^T (\vec{b} - A \vec{x}) = 0 \\ \vec{a}_2^T (\vec{b} - A \vec{x}) = 0 \end{matrix}\right. ∴{a1T(b−Ax)=0a2T(b−Ax)=0,即 [ a ⃗ 1 T a ⃗ 2 T ] ( b ⃗ − A x ⃗ ) = [ 0 0 ] \begin{bmatrix} \vec{a}_1^T \\ \vec{a}_2^T \end{bmatrix} (\vec{b} - A \vec{x}) = \begin{bmatrix} 0 \\ 0 \end{bmatrix} [a1Ta2T](b−Ax)=[00],即 A T ( b ⃗ − A x ⃗ ) = 0 ⃗ A^T (\vec{b} - A \vec{x}) = \vec{0} AT(b−Ax)=0
化简得: A T b ⃗ = A T A x ⃗ A^T \vec{b} = A^T A \vec{x} ATb=ATAx,因而 x ⃗ = ( A T A ) − 1 A T b ⃗ \vec{x} = (A^T A)^{-1} A^T \vec{b} x=(ATA)−1ATb(由第 5 5 5节的证明可知 A T A A^T A ATA可逆)
∴ p ⃗ = A x ⃗ = A ( A T A ) − 1 A T b ⃗ \therefore \vec{p} = A \vec{x} = A (A^T A)^{-1} A^T \vec{b} ∴p=Ax=A(ATA)−1ATb
∴ P = A ( A T A ) − 1 A T \therefore P = A (A^T A)^{-1} A^T ∴P=A(ATA)−1AT
由原理及计算过程可以知道 A A A一定要列满秩
设 A A A有 m m m行 n n n列
-
P P P与 A A A的列空间一致
证明: ① p ⃗ = P b ⃗ \vec{p} = P \vec{b} p=Pb可表示 P P P列空间中的所有向量,且 p ⃗ \vec{p} p可能为 A A A列空间中任何向量,因而二者列空间一致
② P = A ( A T A ) − 1 A T P = A (A^T A)^{-1} A^T P=A(ATA)−1AT,其中 ( A T A ) − 1 (A^T A)^{-1} (ATA)−1是一个 n n n行 n n n列的可逆矩阵,行满秩,而 A T A^T AT也行满秩,因而 ( A T A ) − 1 A T (A^{T} A)^{-1} A^{T} (ATA)−1AT行满秩且有 n n n个主列
又 A A A各列线性无关,因而想得到 P P P中的任意列,均分别对 A A A各列只有一种线性组合方式,这些方式之间 的线性关系与 ( A T A ) − 1 A T (A^T A)^{-1} A^T (ATA)−1AT中各列的线性关系一致,所以 ( A T A ) − 1 A T (A^T A)^{-1} A^T (ATA)−1AT的主列在 P P P中的对应列也是主列 且 P P P只有这 n n n个主列
又 P P P的主列均由 A A A的各列线性组合而来且 A A A中各列均参与组合( ( A T A ) − 1 A T (A^T A)^{-1} A^T (ATA)−1AT行满秩,不存在 0 0 0行,所以 A A A不会有任何一列不参与组合),因而 P P P与 A A A的列空间一致
-
此时若 A A A是方阵,则 P = I P = I P=I
证明: ① A A A为方阵时,其列空间为整个 m m m维空间,包括 b ⃗ \vec{b} b,因而 b ⃗ \vec{b} b的投影即为其本身
② P = A ( A T A ) − 1 A T = A A − 1 ( A T ) − 1 A T = I P = A (A^T A)^{-1} A^T = A A^{-1} (A^T)^{-1} A^T = I P=A(ATA)−1AT=AA−1(AT)−1AT=I
-
P P P为对称矩阵
证明: P T = A ( ( A T A ) − 1 ) T A T = A ( ( A T A ) T ) − 1 A T = A ( A T A ) − 1 A T = P P^T = A ((A^T A)^{-1})^T A^T = A((A^T A)^T)^{-1} A^T = A (A^T A)^{-1} A^T = P PT=A((ATA)−1)TAT=A((ATA)T)−1AT=A(ATA)−1AT=P
-
P 2 = P P^2 = P P2=P
证明: ①用图像可说明 P P b ⃗ = P b ⃗ P P \vec{b} = P \vec{b} PPb=Pb从而得证
② P 2 = A ( A T A ) − 1 A T A ( A T A ) − 1 A T = A ( ( A T A ) − 1 A T A ) ( A T A ) − 1 A T = A ( A T A ) − 1 A T = P P^2 = A (A^T A)^{-1} A^T A (A^T A)^{-1} A^T = A ((A^T A)^{-1} A^T A) (A^T A)^{-1} A^T = A (A^T A)^{-1} A^T = P P2=A(ATA)−1ATA(ATA)−1AT=A((ATA)−1ATA)(ATA)−1AT=A(ATA)−1AT=P
-
-
个人理解
将一个向量投影到一个空间本质上相当于在空间中尽可能表示出原向量,或者说在原向量中删去与空间正交的部分
依几何意义可知投影矩阵一定不可逆
打赏
制作不易,若有帮助,欢迎打赏!