尝试理解ICA（Independent Component Analysis）独立成分分析

1.从鸡尾酒会问题（cocktail party problem）说起

ICA最早是从神经网络领域开始研究的，应用于信号分离、特征提取。为了简单，我们这里从一个经典的例子开始——盲源信号分离（blind signal separation）。

假设在一个开party的房间里有两个人同时说话，房间里两个不同的位置上各放一个麦克风，记录了两段声音（时间信号），x1(t)和x2(t)，这两段声音都记录了两个人说的话，我们怎样得到他们分别说了什么话呢？

记源信号是s1(t)和s2(t)，这个问题可以用以下等式描述：

四个参数aij与说话者跟麦克风的距离有关。

示意图如下：

接收到的信号x1,x2:

需要我们去还原的信号s1,s2：

研究表明，如果s1,s2是统计独立的随机信号，那么就可以用x1,x2去还原。ICA正是利用统计上的独立性从混合信号中分解出源信号的。

2.ICA模型介绍

2.1定义ICA

这里我们用隐含变量（latent variables）模型来描述ICA：

假设有n个观测信号x1,...,xn，来自n个独立成分的混合s1,...,sn 。其中A是nxn的混合矩阵（mixing matrix）。

模型假设如下：

1.si之间是统计独立的；

2.si服从非高斯分布；

3.混合矩阵是方阵（可以放松），且可逆。

那么，，W是A的逆。

独立成分是隐含变量，也就是说他们不能被直接观测到。A和s都是未知的。

2.2ICA的不确定性

1.不能确定独立成分的方差或者说能量

因为A和s都是未知的，s缩放的倍数可以在A上补偿回来：。

因此我们统一假设各独立分量的方差为1，。其实，这样假设之后仍然存在一个不确定性，独立分量乘以-1并不影响方差。不过在实际应用时，并不影响。

2.不能确定各独立分量的顺序

同样，由于A和s都是未知的，在预测时我们可以任意改变A和s对应分量的位置，在矩阵运算中就是乘以一个置换矩阵：。

2.3举个例子

假设独立成分s1,s2服从以下均匀分布：

可以证明出这个均匀分布的均值为0，方差为1。

联合概率密度的分布是这样的，横轴是s1,纵轴是s2：

混合矩阵如下：

使得x1,x2在如下的平行四边形上符合均匀分布，横轴是x1,纵轴是x2：

我们要做的就是通过x1