本篇文章主要是对讲解这个技术的博客进行解释+翻译,所以大部分是作者的原话
https://towardsdatascience.com/stratified-normalization-using-additional-information-to-improve-the-neural-networks-performance-f755021f0ae
原论文:https://www.frontiersin.org/journals/neuroscience/articles/10.3389/fnins.2021.626277/full?source=post_page-----f755021f0ae--------------------------------
在EEG脑成像方向上,有一个最具挑战性的问题:参与者的脑电图活动同质性差。这个问题可以清楚的在下图展示出来。我们使用UMP对EEG数据进行可视化分析。
在左边,颜色表示情绪;在右边,颜色表示数据对应的对象。我们发现一个人的情绪不论是积极的、消极的还是中性的情绪,都以人为单位集中分布,每个人的分布会很集中。因此,如果我们直接尝试使用一个经过训练的模型来对四个参与者的情绪进行分类,并试图推断第五个参与者的情绪,那么结果将非常糟糕。
为了解决这个问题,最常见的解决方案是使用校准阶段来预训练AI模型。然而,这是非常耗时的,所以许多研究人员一直在试图寻找替代解决方案。
尽管本文关注的是脑成像方法,但同样的问题也存在于许多其他领域,如图像识别、语音识别或面部表情。
在过去的几年里,已经有多位研究人员提出了解决这个问题的方法。对于脑成像,大多数提出的解决方案是基于选择鲁棒特征。然而,(1)使用这些特征训练的参与者独立模型的分类器性能仍然低于参与者依赖模型;(2)这些特征是任务相关的,这不仅阻碍了跨任务而且阻碍了跨领域的鲁棒解决方案。
因此,我们研究了一种新的基于参与者的归一化方法,称为分层归一化,用于训练深度神经网络。
该方法的主要思想是将附加信息按比例分配到神经网络中,以提高其性能。重要的是要提醒,这些附加信息必须与我们试图推断的信息不同。例如,在我们的数据集中,我们试图对情绪进行分类,因此使用的附加信息是每个数据的会话和参与者。
我们的分析是针对EEG信号的跨被试情绪分类任务,结果表明,使用分层归一化训练的网络明显优于使用批归一化的标准训练。
为了简要介绍我们的论文,我将重点介绍所提出的方法,并将其与众所周知的批归一化方法进行对比。此外,为了澄清解释,我将首先简要解释我用于分析的数据集。最后,我将展示我们的结果,并以一个小结论结束。
Dataset
使用的数据集为SEED数据集,该数据集是由吕宝良教授领导的BCMI实验室提供的EEG数据集。这个数据集和DEAP数据集是基于脑电图的影响计算中最重要的两个数据集。
它包含从15名参与者收集的62通道脑电图数据,这些参与者对相同的15个电影片段进行了三次会话。对于每一个电影片段,通过平均20个参与者的评分来分配一个情感评分(积极、中性或消极),这些参与者被要求在看完电影后指出三个关键词中的一个。
总之:
- 参加人数:15人
- Sessions x 视频:3 x 15(每个参与者45个视频)
Batch normalization
批归一化首先由Ioffe和Szegedy(2015)引入,以解决内部协变量移位的问题,这是学习过程中神经元激活分布中不必要的漂移。它是神经网络中实现最多的归一化方法,在多种应用中表现出了良好的性能。
正如下面进一步解释的那样,我们根据我们的目的略微调整了该方法。图2说明了批处理规范化方法的实现。对于这种方法,对每个批次的每个特征进行归一化。
图2。批归一化方法。数据按照每个特征进行规范化,独立于参与者和会话。
Stratified normalization
分层归一化是提出的方法,由每个参与者和会话的特征归一化组成。图3详细介绍了分层规范化方法的实现。
与先前的归一化方法相比,该方法对每个特征、参与者和会话的数据进行了归一化。与批处理规范化相比,它的主要缺点是必须包含一个大的批处理集,或者研究每个批处理中每个类有多少数据。
图3。分层归一化法。数据按特性、参与者和会话进行规范化。
Results and conclusion
使用图4所示的体系结构,结果如图5和图6所示。
图5和图6显示了预测值在神经网络输出层的嵌入。结果表明:在输出层,采用分层归一化训练的模型情绪识别准确率较高,参与者识别准确率较低;事实上,这一次,对于分层归一化,而不是批归一化,嵌入在UMAP上更紧凑,并且更容易识别情绪评级,而不是参与者数量——对于参与者数量,颜色的分布似乎表明大部分大脑特征已经消失
这些结果表明,分层归一化方法对跨主体情感识别任务具有较高的适用性,表明该方法不仅可以应用于其他脑电分类数据集,还可以应用于其他需要领域自适应算法的应用。
图5。将神经网络的输出嵌入批处理归一化和三种情绪类别
图6。神经网络输出的分层归一化和三种情绪类别的嵌入。