书接上文,上文介绍了PCA,接下来介绍几种数据降维的方法。
LDA(Linear Discriminant Analysis, 线性判别分析)
理论推导
线性判别分析是一种有监督的降维方法,核心思想是通过线性变换进行降维,使得不同label下的特征最有区分度
假设有多类数据,类别 i i 为
,均值 μi=1|Xi|∑x∈Xix μ i = 1 | X i | ∑ x ∈ X i x ,方差 Σi=1|Xi|∑x∈Xi(x−μi)(x−μi)T Σ i = 1 | X i | ∑ x ∈ X i ( x − μ i ) ( x − μ i ) T
所有数据总体的均值为 μ=1|X|∑x μ = 1 | X | ∑ x
定义间散度矩阵为 Sμ=∑i|Xi||X|(μi−μ)(μi−μ)T S μ = ∑ i | X i | | X | ( μ i − μ ) ( μ i − μ ) T ,可以看作是不同类别中心点的之间的离散程度
定义内散度矩阵为 SΣ=∑iΣi S Σ = ∑ i Σ i 也有地方定义为 SΣ=∑i|Xi||X|Σi S Σ = ∑ i | X i | | X | Σ i ,可以看作是不同类别的集中程度
显然我们希望变换后散度矩阵越大越好,内散度矩阵越小越好,要求得线性变换矩阵 W W 形式上可以写作