Bootstrap

数据降维LDA,ICA,FA,MFA

书接上文,上文介绍了PCA,接下来介绍几种数据降维的方法。

LDA(Linear Discriminant Analysis, 线性判别分析)

理论推导

线性判别分析是一种有监督的降维方法,核心思想是通过线性变换进行降维,使得不同label下的特征最有区分度
假设有多类数据,类别 i i x X i y i ,均值 μi=1|Xi|xXix μ i = 1 | X i | ∑ x ∈ X i x ,方差 Σi=1|Xi|xXi(xμi)(xμi)T Σ i = 1 | X i | ∑ x ∈ X i ( x − μ i ) ( x − μ i ) T
所有数据总体的均值为 μ=1|X|x μ = 1 | X | ∑ x
定义间散度矩阵为 Sμ=i|Xi||X|(μiμ)(μiμ)T S μ = ∑ i | X i | | X | ( μ i − μ ) ( μ i − μ ) T ,可以看作是不同类别中心点的之间的离散程度
定义内散度矩阵为 SΣ=iΣi S Σ = ∑ i Σ i 也有地方定义为 SΣ=i|Xi||X|Σi S Σ = ∑ i | X i | | X | Σ i ,可以看作是不同类别的集中程度

显然我们希望变换后散度矩阵越大越好,内散度矩阵越小越好,要求得线性变换矩阵 W W 形式上可以写作

;