Bootstrap

尝试理解ICA(Independent Component Analysis)独立成分分析

1.从鸡尾酒会问题(cocktail party problem)说起

ICA最早是从神经网络领域开始研究的,应用于信号分离、特征提取。为了简单,我们这里从一个经典的例子开始——盲源信号分离(blind signal separation)。

假设在一个开party的房间里有两个人同时说话,房间里两个不同的位置上各放一个麦克风,记录了两段声音(时间信号),x1(t)和x2(t),这两段声音都记录了两个人说的话,我们怎样得到他们分别说了什么话呢?

记源信号是s1(t)和s2(t),这个问题可以用以下等式描述:


四个参数aij与说话者跟麦克风的距离有关。

示意图如下:



接收到的信号x1,x2:



需要我们去还原的信号s1,s2:


研究表明,如果s1,s2是统计独立的随机信号,那么就可以用x1,x2去还原。ICA正是利用统计上的独立性从混合信号中分解出源信号的。


2.ICA模型介绍

2.1定义ICA

这里我们用隐含变量(latent variables)模型来描述ICA:

假设有n个观测信号x1,...,xn,来自n个独立成分的混合s1,...,sn 。其中A是nxn的混合矩阵(mixing matrix)。

模型假设如下:

1.si之间是统计独立的;

2.si服从非高斯分布;

3.混合矩阵是方阵(可以放松),且可逆。

那么,,W是A的逆。

独立成分是隐含变量,也就是说他们不能被直接观测到。A和s都是未知的。


2.2ICA的不确定性

1.不能确定独立成分的方差或者说能量

因为A和s都是未知的,s缩放的倍数可以在A上补偿回来:

因此我们统一假设各独立分量的方差为1,。其实,这样假设之后仍然存在一个不确定性,独立分量乘以-1并不影响方差。不过在实际应用时,并不影响。

2.不能确定各独立分量的顺序

同样,由于A和s都是未知的,在预测时我们可以任意改变A和s对应分量的位置,在矩阵运算中就是乘以一个置换矩阵:


2.3举个例子

假设独立成分s1,s2服从以下均匀分布:



可以证明出这个均匀分布的均值为0,方差为1。

联合概率密度的分布是这样的,横轴是s1,纵轴是s2:


混合矩阵如下:


使得x1,x2在如下的平行四边形上符合均匀分布,横轴是x1,纵轴是x2:


我们要做的就是通过x1

;