摘要
注意力缺陷多动障碍(ADHD)是一种影响儿童和青少年的广泛性神经行为障碍,早期检测对于有效治疗至关重要。脑电(EEG)连接测量可以揭示EEG记录之间的相互依赖关系,突出大脑网络模式和功能行为,从而提高诊断准确性。本研究提出了一种将线性和非线性大脑连接图与基于注意力的卷积神经网络(Att-CNN)相结合的新型ADHD诊断方法。利用Pearson相关系数(PCC)和锁相值(PLV)创建来自不同EEG频段的融合连接图(FCM),然后将其输入到Att-CNN中。将注意力模块放置在CNN的最新卷积层之后。评估不同优化器(Adam和SGD)的性能和学习率。所提模型在使用SGD优化器、在θ频段的FCM中、学习率为1e-1的条件下,分别获得了98.88%的准确率、98.41%的精度、98.19%的召回率和98.30%的F1分数。通过使用FCM、Att-CNN和先进的优化器,该技术有望成为ADHD早期诊断的可靠工具,从而大大提高患者的治疗效果和诊断准确性。
引言
注意力缺陷多动障碍(ADHD)是一种常见的神经行为疾病,通常始于儿童期或青春期,并可能持续至成年期。ADHD有三个主要特征:注意力不集中、过度活跃和冲动行为。大约有5%的人口受到ADHD的影响,其症状通常在12岁之前就会表现出来。据估计,儿童中约有12.1%的男孩和3.9%的女孩患有ADHD。具体来说,根据美国2020至2022年的国家健康访谈调查数据显示,5至17岁儿童中被诊断为ADHD的患病率为11.3%。男童的患病率(14.5%)通常高于女童(8.0%)。
ADHD患者经常会面临一系列问题,包括社交孤立和孤独感、建立和维持人际关系困难,以及持续的学业挑战和成绩不佳。因此,早期发现ADHD对于改善患者的生活质量至关重要。早期诊断还可以实现及时干预,显著减少潜在的并发症。当ADHD被及早诊断时,则可以更早地采取行为疗法、教育支持和药物治疗等干预措施。这些干预措施可有效管理ADHD症状(如注意力难以集中、过度活跃和冲动行为)。通过对这些核心症状进行干预,可以显著改善ADHD患者的日常功能和生活质量。
儿童ADHD通常由临床精神科医生和心理学家进行诊断评估。诊断过程包括评估《精神疾病诊断与统计手册》(DSM-V)标准、进行医学检查、从学校收集信息、采访家庭成员、使用ADHD评定量表(如Conners评定量表),以及进行神经心理学评估。目前,尚无广泛使用的客观评估工具来支持ADHD的诊断并减少主观性。因此,通过计算方法获得第二意见,不仅可以增强临床医生对其评估的信心,还能提高诊断效率。
通过观察儿童行为至少六个月,并使用EEG评估儿童大脑功能的方式进行ADHD诊断,有助于该疾病的及早发现。有研究者认为,ADHD主要是由负责调节注意力和专注力的脑区功能障碍所致。EEG提供了有关个体大脑内神经活动的信息,并在检查大脑的功能性和有效连接性方面具有诸多优势。这些优势包括响应时间快、便携性以及数据记录高效。正是这些因素使得EEG成为研究大脑不同区域如何相互通信的合适选择。
尽管已取得积极的研究成果,但在实现一个准确且简单的ADHD分类模型方面仍存在着巨大的差距。当前的连接映射方法通常依赖于单一的方式,导致特征值重复或冗余。这种冗余可能会降低使用此类连接特征图的分类器的效率和效果。此外,许多采用特征提取技术的研究未能考虑脑区之间的相互关系,而是独立提取特征。这种忽视导致了一种权衡,因为这些方法未能充分利用区域之间的连接潜力,也未能全面捕捉线性和非线性关系。
本研究提出的方法通过将融合的大脑连接与线性和非线性连接测量相结合,并辅以基于注意力机制的卷积神经网络(Att-CNN)来解决这些局限性。该方法充分利用了每种技术的优势,从而提供了EEG数据的整体和详细表征。这样做可以更有效地捕捉与ADHD相关大脑活动的复杂动态,最终在保持模型简洁性的同时提高分类准确性。因此,本研究尝试引入一种将线性和非线性大脑连接测量与Att-CNN相结合的新型分类方法,以提高ADHD的诊断准确性,同时确保模型的简洁性和实用性。
材料与方法
本研究提出的框架如图1所示。接下来将详细解释每个步骤。
图1.使用融合的大脑连接图和基于注意力机制的CNN来分类ADHD与健康对照组(HC)的框架。
数据集
本研究使用了一个开放访问的EEG数据集,该数据集包含121名儿童,其中61名儿童由经验丰富的儿童精神科医生根据《精神疾病诊断与统计手册》第四版(DSM-IV)标准诊断为ADHD。同时,健康对照组(HC)包括60名儿童,这些儿童无心理障碍、癫痫、物质滥用或头部损伤病史。所有儿童均为右利手,平均年龄为9.73±1.76岁。在Roozbeh医院的心理与精神病学研究中心(Tehran, Iran)使用数字设备(SD-C24, Sholeh Danesh Co., Tehran, Iran)记录EEG信号,采用国际10-20标准系统的19通道设置,采样频率为128Hz,EEG分辨率为16位。实验在安静的房间内进行,并要求儿童尽量减少运动。
鉴于ADHD儿童普遍存在视觉注意缺陷,因此本研究设计了专门针对视觉注意任务的EEG记录方案。在任务过程中,研究人员向儿童展示一些引人入胜的人物图片,并要求他们统计每张图片中的人物数量。在儿童对前一张图片做出反应后,立即呈现下一张图片。EEG记录的持续时间由儿童的表现决定,答案的正确性不作为考虑因素。ADHD组的EEG记录平均时长为154.59s,标准差为58.13s,而HC组的平均时长为124.91s,标准差为29.90s。
预处理
使用EEGLAB工具箱(版本2022.1)对原始EEG信号进行预处理。首先,EEG信号经过0.5Hz的高通滤波以减少低频漂移。然后,使用Clean Rawdata和伪影子空间重建(ASR)插件(Cleaning Raw Data and Artifact Subspace Reconstruction Plugin 2024)自动去除由电极位移引起的伪影(默认设置)。该插件有助于去除坏导和坏段。它也可以删除读数平坦或噪声较大的通道(由其标准差决定),以及那些与其他通道相关性较差的通道(相关性阈值为0.8)。
在此过程中,使用ASR算法识别并剔除坏段。使用球面样条插值法对缺失或被拒绝的通道进行插值。随后,对所有通道进行共同平均重参考。然后,应用独立成分分析(ICA)对EEG信号进行分解,去除伪迹成分,如肌电和视觉任务中常见的眨眼或眼球运动。接下来这些成分通过自动ICLabel插件进行识别并排除。使用基于Kaiser窗的有限脉冲响应滤波器对脑电信号进行滤波,五个常见频段如下:Delta(δ:1-4Hz)、Theta(θ:4-8Hz)、Alpha(α:8-13Hz)、Beta(β:13-30Hz)和Gamma(γ:30-45Hz)。然后,将每个频段内的EEG信号分割成不重叠的时段,每个时段包含768个采样点,相当于6s。
线性与非线性连接图
特征提取技术将输入数据转换为新的维度,这些维度代表了从原始输入数据中衍生出的各种组合(包括线性、非线性和方向性)。两个电极之间的连接强度表示实验过程中两个皮层区域之间的相互作用。这种相互作用可以表现为直接相关、反向相关或同步,具体取决于研究的具体方面。此外,这些关系的性质也会因分析的连接类型而有所不同。本研究采用了两种连接方法:Pearson相关系数(PCC)和锁相值(PLV)。PCC是一种线性功能连接方法,而PLV则是一种非线性连接方法。PCC是最常用的线性相关指标之一。这个统计指标衡量了变量之间相互依赖的程度,表示大脑中两个区域(电极)之间的线性关联程度。PLV是一种用于测量两个大脑区域之间相位同步性的方法。
融合连接性图
融合是指将多个信息源结合起来,以创建一个更全面的表征。融合技术广泛应用于图像处理、医学影像、遥感和监控系统等领域,以提高数据质量、准确性或鲁棒性。将融合过程应用于PCC和PLV大脑连接图时,涉及将多个图中的关键信息整合到一个单一的、综合的图中。这种融合图的信息量和准确性超越了任何单一源图,能够捕捉到所有关键细节。融合的目标是减少数据量,并为人工解读和机器分析创建更合适、更易理解的表征方式。另一方面,在不增加数据量的情况下增强信息,是融合方法相较于单一方法生成的连接图的一个显著优势。
使用Hermes工具箱计算PCC和PLV指标的连接性。在生成每个感兴趣频段的PCC和PLV连接图后,将它们融合为一个矩阵。这种融合是可行的,因为生成的连接图(PCC和PLV)是无向的且对称的。因此,融合后的连接图(FCM)的PCC值位于下三角,而PLV值位于上三角。值得注意的是,尽管进行了这种增强,FCM的大小仍与使用单个方法生成的连接图相当,这使得它成为后续分类任务中提高信息质量的一种成本效益高且高效的策略。
图2a和b分别展示了使用PCC和PLV构建的连接图。可以观察到,连接映射通常包含冗余信息,部分或完全冗余,例如使用PCC和PLV等方法生成的连接图通常具有对称性,即上下部分是镜像对称的,并且存在部分冗余信息。这种冗余会在分类过程中增加计算成本。相比之下,FCM的优势在于它整合了来自不同连接方法的上下部分,增强了特征图中的信息。在这张图中,连接图以热图形式呈现,其中X轴和Y轴分别对应电极位置,每个像素的颜色强度表示每对电极之间的连接强度。对角线像素表示相同电极之间的完美连接。
图2.ADHD被试在θ频段的连接图示例。a、b、c分别表示采用PCC、PLV,以及融合方法构建的连接图。
基于注意力机制的CNN(Att-CNN)
在各种深度学习方法中,卷积神经网络(CNN)是最成功的二维数据分类器。它们能够从输入数据中隐式地提取相关特征。CNN架构通常包括输入层、若干卷积-子采样层、展平层、全连接层和输出层。CNN的初始操作包括使用一个卷积核对输入(矩阵或图像)进行卷积,生成一个新的卷积矩阵。随后的子采样操作会对卷积矩阵进行降维,同时保留重要特征。在经过一次或多次卷积-子采样操作后,输出会通过全连接的密集层进行处理。本研究提出了一种新的卷积神经网络(CNN)架构,利用多个卷积层、池化操作和通道注意力机制来增强特征提取并提高分类准确性。
图3展示了所提出的基于注意力机制的卷积神经网络(Att-CNN)模型,而表1则总结了该模型的参数。
图3.Att-CNN示意图。
表1.所提出的Att-CNN模型参数。
实验
实验设置
首先,使用MATLAB软件进行EEG信号预处理和计算功能连接矩阵(FCMs)。然后,使用Keras TensorFlow库和NVIDIA T4 Tensor Core GPU在Google Colab上实施Att-CNN。该模型使用留出验证法进行验证。ADHD和HC被试数据被划分为训练集、验证集和测试集(分别为70%、10%和20%)。在划分后,计算每个被试的功能连接矩阵(FCMs)。该方法确保了每个被试的数据不会在训练集、验证集和测试集之间共享,从而避免了数据泄漏。
由于交叉验证法的计算要求较高,本研究选择了留出法。交叉验证需要对每折进行大量的模型再训练,既耗费资源又耗费时间,特别是在优化超参数时。为了平衡模型评估与计算可行性,本研究选择了70-10-20的训练-验证-测试数据集分割法。该方法使我们能够在管理计算资源的同时,优化超参数并有效评估模型性能。尽管交叉验证提供了更为全面的评估,但留出法为在资源限制下获得可靠结果提供了一个实用的解决方案。
使用准确率、精度、召回率和F1分数指标来评估该模型的性能。本研究中使用的批量大小为128,并且最多训练250轮(epochs)。同时,采用了早停技术以防止过拟合,当验证集损失在连续50个epoch内没有改善时,训练将停止。为了确定最佳优化器和学习率(LR),本研究使用Adam和SGD两种优化器进行训练,LR范围为1e-1到1e-5,步长为10。采用二元交叉熵函数作为损失函数。其他未提及的超参数则采用了Keras TensorFlow库指定的默认值。
结果与讨论
本研究提出了一种用于区分ADHD儿童和健康对照组(HC)儿童的新型分类方法,该方法使用了FCM和三种分类器:一个无注意力的基线CNN和两个基于注意力的CNN。对于第一部分的分析,使用PCC和PLV两种方法进行连接映射,以捕捉与ADHD和HC常见频段相关的复杂大脑连接模式。ADHD组的FCMs如图4所示。
图4.右上三角区域表示使用PLV计算的FCMs,而左下三角区域则表示通过PCC计算的FCMs。
对于第二部分的分析,为了评估注意力模块位置的影响,注意力模块被嵌入到了两个不同的位置。首先,嵌入到最终卷积层之后,然后是嵌入到第一个卷积层之后。相应结果如表2所示。表中总结了基线CNN和两种不同注意力放置方法[即模型1(注意力模块嵌入在最终卷积层之后)和模型2(注意力模块嵌入到第一个卷积层之后)]的分类准确率。在不同的学习率(LRs)下,使用Adam和SGD两种优化器在五个频段(δ、θ、α、β、γ)中评估每个模型的性能。
表2.基于不同优化器和不同学习率在五个感兴趣频段中评估模型的分类准确率(%)。
分析表明,模型1和模型2(包含注意力机制)的性能优于基线模型。具体来说,这些模型在使用Adam优化器,学习率为1e-3时表现最佳,在所有频段中取得了最高的准确率。模型1的表现略优于模型2。对于所有模型,SGD优化器在学习率较低时效果较差。这些结果强调了注意力机制和适当的学习率对于提高模型在连接图上的表现至关重要。
表3和图5总结了各模型的性能指标。基线模型在α频段的准确率为98.73%,无论使用Adam优化器(在第111个epoch时停止训练)还是SGD优化器(在第250个epoch时收敛),而且均表现出较高的精度、召回率和F1分数。模型1在θ频段的准确率分别为98.50%(使用Adam,在第95个epoch时停止训练)和98.88%(使用SGD,在第122个epoch时停止训练),并且精度、召回率和F1分数均较高。模型2在θ频段的准确率分别为98.50%(使用Adam,在第113个epoch时停止训练)和98.65%(使用SGD,在第131个epoch时停止训练),在这两种配置下均表现出强大的性能。
表3.性能最佳模型的评估指标,包含其优化器、学习率、频段以及训练停止时的epoch。
图5.根据优化器比较最佳性能模型的评估指标。
图6显示了表3中列出的性能最佳模型的准确率曲线,并展示了它们的收敛趋势以及在最多250个训练周期内停止训练的具体epoch。为了实现这一点,在训练过程中采用了早停机制,使得模型在不同的epoch停止训练,从而防止过拟合。
图6.表3中列出的性能最佳模型的准确率曲线。
使用Adam优化器训练的基线CNN模型,学习率为1e-3,在第111个epoch完成训练。该模型的准确率达到98.73%,精度、召回率和F1分数分别为97.96%、98.19%和98.07%。该配置的准确率曲线显示,训练和验证准确率在初期迅速上升,并在大约50个epoch时趋于稳定。另一方面,使用SGD优化器训练的基线模型,学习率为1e-1,在第250个epoch完成训练,准确率同样为98.73%,精度、召回率和F1分数分别为98.40%、97.73%和98.07%。该模型在初期的准确率波动较大,但最终趋于稳定,训练和验证的准确率在大约50个epoch时收敛。
模型1在最终卷积层后加入了注意力机制,表现出了显著的性能提升。当使用Adam优化器,学习率为1e-3的情况下,该模型在第95个epoch完成训练,准确率为98.50%,精度、召回率和F1分数分别为98.17%、97.28%和97.72%。其准确率曲线显示准确率迅速上升,并在大约30个epoch时趋于稳定,训练和验证的准确率基本一致,表明模型具有良好的泛化能力。当使用SGD优化器,学习率为1e-1时,模型1在第122个epoch完成训练,准确率为98.88%,精度、召回率和F1分数分别为98.41%、98.19%和98.30%。尽管初期的准确率有所波动,但该模型的准确率曲线在大约40个epoch时趋于稳定,且训练准确率略高于验证准确率。
模型2在第一个卷积层之后加入了注意力机制,也表现出了更高的性能。当使用Adam优化器,学习率为1e-3时,该模型在第113个epoch完成训练,准确率达到98.50%,精度、召回率和F1分数分别为98.39%、97.05%和97.72%。其准确率曲线呈平稳提升的趋势,在大约30个epoch时趋于稳定,训练和验证准确率非常接近,表明训练效果较好。当使用SGD优化器,学习率为1e-1时,模型2在第131个epoch完成训练,准确率达到98.65%,精度、召回率和F1分数分别为98.18%、97.73%和97.95%。与模型1类似,模型2的准确率曲线在初期也有些波动,但最终在40个epoch左右趋于稳定,且训练和验证准确率非常接近。
注意力机制的整合和优化器的选择对CNN模型的性能有显著影响。与SGD相比,Adam优化器通常能够更平稳、更快速地收敛,但两者最终的准确率相当。与基线模型相比,包含注意力机制的模型1和模型2在泛化和性能方面都略胜一筹。早停技术成功地防止了所有模型和优化器的过拟合,这一点可以从训练和验证准确率曲线的紧密吻合得到证明。
结论
本研究提出了一种新的框架,通过融合大脑连接图和注意力卷积神经网络(Att-CNN)来对ADHD和HC进行分类。研究结果表明,基于注意力机制的模型优于基准CNN,并且具有更好的泛化能力和整体性能。具体而言,结合线性和非线性连接测量,使我们能够更有效地捕捉复杂的大脑连接模式,从而提高诊断的准确性。Adam和SGD优化器在不同学习率下的实验结果表明,仔细调整超参数对于优化模型性能至关重要。此外,早停技术有效地降低了过拟合的风险,这一点可以从训练和验证准确率曲线之间的吻合程度看出。总的来说,本研究方法在利用先进的脑电分析和机器学习技术进行ADHD诊断方面迈出了重要一步,对于加强临床评估和干预具有重要意义。
参考文献:Ahmadi Moghadam, E., Abedinzadeh Torghabeh, F., Hosseini, S.A. et al. Improved ADHD Diagnosis Using EEG Connectivity and Deep Learning through Combining Pearson Correlation Coefficient and Phase-Locking Value. Neuroinform (2024). http://doi.org/10.1007/s12021-024-09685-3
小伙伴们关注茗创科技,将第一时间收到精彩内容推送哦~