背景
图表征学习能够通过利用网络结构和节点特征来检测拓扑模式。我们的探索基于将图神经网络架构和机器学习应用于静息态功能性磁共振成像(rs-fMRI)数据,以检测精神分裂症。我们的研究采用单一站点的数据,以避免多站点获取的神经影像数据在泛化性方面的局限。
结果
我们的图神经网络模型性能与机器学习模型相当,这些模型均使用从大脑图中各个感兴趣区域(ROI)之间的功能相关性计算得出的69个图论指标进行训练。我们的深度图卷积神经网络(DGCNN)展现出了令人期待的平均准确率0.82和敏感度0.84。
结论
本研究通过利用脑功能连接的变化,深入探讨了先进图论方法和机器学习在fMRI数据中用于检测精神分裂症的应用。研究结果展示了使用传统机器学习技术以及基于图神经网络的方法,利用从fMRI数据中提取的特征来检测精神分裂症的能力。本研究还提出了两种获取疾病潜在生物标志物的方法,其中许多都得到了该领域研究的证实,这可以进一步帮助理解精神分裂症这一精神障碍。本文发表在BMC Neuroscience杂志。
背景
精神分裂症是一种慢性神经发育障碍,表现为大脑功能连接的异常,影响着全球约2%的人口。其特征包括幻觉、思维紊乱和语言混乱。由于对该疾病的神经病理学认识不完整,以及患者之间存在细微差异,获得可靠的诊断变得具有挑战性,可能导致误诊。幸运的是,研究发现在精神病前期前驱阶段检测精神分裂症并在同一阶段进行认知行为治疗,能够有利地影响疾病进程。我们的研究利用了早期精神分裂症检测所带来的优势,因为它有可能改善治疗效果。
静息态功能性磁共振成像(rs-fMRI)是研究认知脑功能和精神分裂症等精神疾病的常用模态。基于rs-fMRI扫描(测量大脑中的血氧水平依赖(BOLD)信号),可以通过将大脑建模为由节点和边组成的复杂网络来捕捉大脑的高层功能组织,并使用图论研究大脑的拓扑关系。由于机器学习(ML)在医疗领域的快速发展,ML(机器学习)和图论的结合在这方面显示出了有前景的结果。多项研究使用了从逻辑回归等数学简单模型到集成学习技术等更复杂模型的各种ML模型。
由于当前形式的脑图构成非欧几里得数据集,其结构特征和节点特征及其在神经学框架下的潜在模式可能无法通过传统机器学习模型完全捕捉。近期,图卷积网络(GCNs)被用于尝试更精确地检测脑网络的复杂和抽象交互。双相障碍、抑郁症和阿尔茨海默病等其他神经系统疾病也已通过图神经网络(GNNs)进行研究。如引文[17,18,19]所述,也已开展了多项使用GNNs进行fMRI分析的研究。另一个改善精神分裂症认识的研究领域是使用特征选择、多变量分析、深度学习等进行生物标志物检测。
基于对先前研究的评估,我们的研究包括以下关键工作:
1.利用图论、机器学习和图表征模型来理解和识别精神分裂症。
2.引入深度图卷积神经网络(DGCNN)架构用于精神分裂症患者和对照组受试者的分类。
3.由于应用的敏感性,使用GNNExplainer、单变量特征分析和Shapley加性解释(SHAP)值来增强模型的可解释性(编者注:SHAP (SHapley Additive exPlanations) 值是一种基于博弈论中Shapley值的模型解释方法)。
4.提出两种创新的特征选择方法——RLF特征选择和SpeCo(谱聚类和共现检测),用于识别大脑感兴趣区域(ROIs)形式的生物标志物,这有助于区分精神分裂症患者和对照组受试者的大脑特征。图1显示了本研究所执行的高层次步骤序列。
图1 当前研究的工作流程
材料与方法数据
fMRI数据来自公开可用的UCLA神经精神表型联盟LA5c研究,其中包含50名精神分裂症患者和122名对照组受试者。使用的数据包含所有受试者的结构和功能性MRI扫描。数据是不平衡的(对照组受试者较多),这个问题通过"数据增强"部分描述的数据增强方法进行了处理。该数据集可从OpenNeuro仓库下载。更多关于数据集获取的信息可以在这里和补充文件1:S2节中找到。
预处理
fMRI数据包含60×60×30=108,000个体素,这些体素在指定的时间段(TA)内捕获。预处理对于去除噪声、处理患者头部运动和纠正其他个体特异性至关重要。为此,我们使用以下步骤的预处理流程:功能重对齐、层时校正、异常值检测、分割、标准化、功能平滑和时间带通滤波。
功能重对齐:预处理流程的第一步是功能重对齐和去扭曲,其中所有扫描都使用B样条插值与参考图像(第一次扫描)进行协配准和重采样。这纠正了由患者头部运动引起的任何失真。
层时校正:第二步是层时校正,纠正和调整由延迟导致的功能数据不同切片之间的任何时间相关错位。
异常值检测:第三步是异常值检测,通过检查帧间位移和寻找数值中的任何尖峰,基于BOLD(血氧水平依赖)信号和患者头部运动来识别潜在异常值。
分割和标准化:第四步是分割和标准化,其中每个解剖图像被分割为3部分——脑脊液组织、灰质和白质。功能和解剖数据分别重采样为2mm³和1mm³大小的体素。
功能平滑:第五步使用卷积运算和8mm大小的高斯核过滤器去除每个体素时间序列信号中的噪声。这改善了峰值信噪比(PSNR)。
时间带通滤波:最后一步是去噪,我们将每个信号通过大小为(0.01, 0.08)的时间带通滤波器。
在此阶段,我们获得了每个受试者的每个体素的预处理时间序列信号。由于基于ROI的技术相比基于体素的方法已证明具有更高的效果,我们采取了额外的措施,将各个区域内所有体素的时间序列数据组合并计算平均值,以获得每个区域的单一时间序列。考虑到每个受试者包含108,000个体素,这个过程也有助于解决高维度的挑战。为此,我们根据AAL3图谱和哈佛-牛津皮质图谱将大脑划分为164个区域。完整的ROI列表及其对应坐标可在补充文件1:S1节中找到。图2描绘了一个受试者在预处理流程每个阶段的中间结果。
图2 预处理流程
脑网络的创建
为了对大脑不同感兴趣区域(ROIs)之间的连接进行图形分析,并量化这些ROIs之间的功能连接,单独的fMRI数据是不够的。它需要被转换为不同的表征形式。最常用的技术是使用皮尔逊相关系数(PCC) (公式1)来关联大脑区域。首先,计算每对ROIs的PCC(皮尔逊相关系数)。然后,对这些中间值应用反双曲正切函数,得到如(公式2)中定义的Fisher变换的双变量相关系数。Fisher变换的相关系数值对皮尔逊相关系数值进行标准化。由于大脑中负功能连接的生物学解释尚不明确,所有负相关值都被设为0。
其中:r是皮尔逊相关系数矩阵,R是每个ROI内的BOLD时间序列,Z是Fisher变换相关系数矩阵
由此形成的邻接矩阵(r)是一个164×164的加权矩阵,它是大脑加权图的数学表征,也称为"脑图"。从几何角度来看,这个脑图包含164个节点,每个不同的节点对应于大脑中164个不同的ROIs中的一个,而每对ROIs之间的边的权重等同于两个ROIs之间的功能相关性。这导致脑图中有164×164个不同的边,这就是邻接矩阵(r)所表示的内容。图3显示了大脑区域或ROIs之间相关性的视觉表征。
图3 不同ROIs之间的功能相关性
脑网络的二值化
将加权脑图二值化是通过对权重应用阈值来将脑图中节点间的加权连接或边转换为二值的过程。这个过程将连续或加权网络转换为二值表征,其中边基于所选择的权重阈值要么存在(赋值为1)要么不存在(赋值为0)。我们采取了这个额外步骤,使用9个固定阈值:0.00、0.05、0.10、0.15、0.20、0.25、0.30、0.35、0.40将每个生成的加权图转换为相应的无权图。加权图和无权图都保持无向性质。如"初步分析"部分所详述,我们评估了每个阈值的分类性能,以确定二值化矩阵的最优固定阈值。使用这个确定的阈值转换的图将用于研究的其余部分。图4显示了一个加权邻接矩阵,当使用0.20的阈值进行二值化时,创建了如图5所示的二值矩阵。
图4 加权矩阵
图5 二值矩阵
特征生成
基于种子的连接性是我们用于理解和分析大脑功能连接的方法之一。这些度量是针对脑图中的每个ROI计算的。因此,为了捕捉脑图的复杂性并为机器学习和图神经网络模型生成充分的特征,我们计算了属于2个广泛类别的69个图度量:节点和全局。节点或局部特征提供了关于节点连接性和大脑中某些节点重要性的信息。对每个受试者的164个ROI中的每一个都生成了26个节点特征,这为每个受试者提供了26×164=4264个特征。全局特征让我们洞察整个图,并为每个受试者生成一个值。在每个类别内,特征可以根据用于生成它们的矩阵进一步分为二值和加权两类。表1提供了生成特征的摘要。所有69个图特征的定义可以在补充文件1:S3节中找到。
表1 生成的图属性摘要
初步分析
我们通过执行探索性数据分析(EDA)和脑图可视化开始了对数据的初步检查。作为示例,图6描绘了一个定性热图,展示了对照组和精神分裂症患者的平均加权矩阵。这种可视化方法通过使用不同的配色方案来帮助辨识权重的细微变化。
图6 加权矩阵的热图
此外,我们进行了基于特征的分析,得到了一些有趣的结果。我们在两个层面进行了这项分析:全局和节点。
在全局层面,发现精神分裂症患者的平均最大团比对照组受试者高2.5-3倍(编者注:在图论中,"团"(clique)是指图中的一个完全子图,即这个子图中的任意两个顶点之间都有边相连。"最大团"(maximal clique)是指不能再添加任何其他顶点的团,也就是说它是一个不能再扩大的完全子图)。还发现精神分裂症患者的平均聚类系数低于对照组受试者,且平均最短路径长度较高,这与引文[27]的结果一致。
从节点角度来看,首先对属于两个类别的所有受试者的每个ROI的每个节点特征进行平均,从而进行比较。这为精神分裂症患者和对照组受试者分别产生了26×164即4,264个特征。然后,对每个ROI所属的平均团数进行了比较。与对照组相比,精神分裂症患者有46个ROIs包含在超过220%的团中,90个ROIs包含在超过170%的团中。
二值化阈值的比较
为每个受试者获得的脑网络是一个加权邻接矩阵。我们通过基于阈值将原始图中节点之间的加权连接(边)转换为边要么存在要么不存在(1或0)的二值图来二值化每个加权脑图。为确定最能捕捉脑网络微妙特征的二值化阈值,我们比较了从0.00到0.40以0.05为增量的各种阈值的效果。对所有172个受试者,每个阈值值生成了36个全局二值度量。然而,断开的图(具有孤立点)的数量在0.35以后开始增加(在0.35阈值时,42个受试者有断开的图,在0.40阈值时,115个受试者有断开的图),这妨碍了某些图特征的计算。因此,比较限制在0.30的阈值值。我们采用3个机器学习模型:随机森林、XGBoost和AdaBoost来比较这些阈值的性能。这3个机器学习模型在精神分裂症患者和对照组患者的全局二值邻接矩阵上进行训练和测试。所有模型都使用10折网格搜索交叉验证,并使用5个指标进行评估,即准确率、特异性、敏感性、精确率和F1分数。完整的结果列表可在补充文件1:S4节中找到。虽然没有单一阈值在统计上优于其他阈值,但如图7所示,0.2在平均指标方面产生了最有前景的结果。因此,我们在研究的其余部分使用了在0.2处二值化的图的特征。
图7 AdaBoost、随机森林和XGBoost的准确率、特异性、敏感性、精确率、F1分数的变化
数据增强
数据的类别不平衡可能导致模型学习产生偏差。此外,已知神经网络在更大的数据集上表现更好。为解决这个问题,采用了一种数据增强技术,即从每个受试者中随机采样5对ROIs,并添加范围为(0.0, 0.3)的均匀噪声。这相当于在164×164个可能值中扰动10个值,即0.037%的值。选择这个小数字的目的是在保持脑图大部分特性的同时,生成更多数据以增加模型的稳健性。使用两个经过原始数据训练的机器学习模型(随机森林和XGBoost)来生成这些标签。最终标签考虑这两个机器学习模型的集体决策,投票出现平局的合成矩阵被舍弃。
机器学习
我们使用了5个机器学习模型进行分类:AdaBoost、决策树、K近邻(KNN)、支持向量机(SVM)和逻辑回归。未使用随机森林和XGBoost,以防止重复使用相同的模型(这些模型已用于预测增强数据的标签)可能带来的偏差。每个机器学习模型定义的超参数可在补充文件1:S5节中找到。
首先,包含全局图度量的特征数据集通过标准化和归一化流程进行预处理。使用GridSearchCV获取最优超参数并在不同的训练-测试分割上测试模型。表2报告了具有显著性的平均指标。
图神经网络(GNN)
GNN可以直接使用非欧几里得数据作为输入,并通过节点特征和邻域关系利用网络级信息。对于每个GNN模型,我们使用二值图以及二值和加权节点属性作为输入。使用了2种不同的GNN架构。训练中使用了早停机制,并配合Adam优化器。GNN模型的两种变体都执行监督图分类。
图卷积网络
图卷积网络(GCN)对图结构数据进行半监督学习,它基于卷积神经网络的修改版本,该修改允许模型在图而不是图像上进行训练[30]。其架构如图8所示。
图8 GCN架构
深度图卷积神经网络
DGCNN(深度图卷积神经网络)使用与GCN中指定的类似的卷积层,但在消息如何通过层传播方面有所改变。DGCNN使用独特的SortPooling技术[15],该技术作为卷积操作的一部分以一致的顺序对节点进行排序,将同构图映射到相同的输出标签,这在训练具有结构差异的图时很有用。其架构如图9所示。使用10折交叉验证来评估两个模型。
图9 深度GCN架构
生物标志物检测
本文提出以下两种新方法来识别精神分裂症的潜在生物标志物,其结果在"显著脑区"部分展示。
方法1:ROI-局部特征对(RLF)特征选择
我们使用每一对(ROI,局部特征)作为独立特征,为每个受试者生成164×26=4264个特征。使用特征选择技术,即SHAP和单变量特征选择,来识别最能解释数据的前100个RLF对(ROI-局部特征对),这些RLF对中最频繁出现的ROIs被认为是重要的。
方法2:谱聚类和共现检测(SpeCo)
在SpeCo中,使用谱聚类将ROIs分为不同簇。然后,分别为精神分裂症患者和对照组受试者创建共现矩阵。这些164×164维的矩阵分别记录每个精神分裂症患者和对照组受试者中所有ROI对在同一簇中的共现情况。然后,通过统计多数来归一化值,即如果某对ROI在一个簇中的共现超过预定义阈值,则将该对标记为共现对。这种方法在不同的簇数范围(2, 5)和不同的统计多数阈值范围(90-95%)下运行。仅在精神分裂症患者或对照组受试者中共现,而不在两者中都共现的对被认为对区分精神分裂症和非精神分裂症受试者具有信息价值。
结果分类器性能
我们比较了不同的机器学习分类器,并使用GridSearchCV获得每个机器学习模型的最佳参数。获得的最高敏感度为93.3%(来自决策树),最高特异性为96%(来自SVM)。决策树的高敏感度表明它在检测输入特征的细微变化方面表现理想,这对于精神分裂症检测等医学诊断的准确决策至关重要。针对我们的问题陈述,SVM的高特异性对于确保健康个体不被误分类为患病很重要,因为假阳性可能导致不必要的医疗程序。
在GNN(图神经网络)模型中,DGCNN(深度图卷积神经网络)的表现优于GCN,尽管差异在统计上并不显著。GCN和DGCNN获得的最高敏感度均为96%,最高特异性为94%(来自DGCNN)。由于其高特异性,DGCNN展示了正确将健康或非精神分裂症患者分类为阴性的强大能力,而不产生假阳性结果。表2中可以看到所有模型的平均指标。
表2 机器学习和GNN模型性能总结
显著脑区RLF成对特征选择
RLF(ROI-局部特征)成对特征选择得出以下突出区域:缘上回(前部分区)、下颞回(后部、颞枕部、前部分区)、上颞回(后部分区,左侧)、上顶叶小叶(右侧)、中颞回(颞枕部分,右侧)。
-
缘上回参与多种认知功能,该区域的改变可能与语言相关障碍、工作记忆缺陷或语音处理障碍有关。
-
下颞回(后部、颞枕部)在视觉对象识别和感知中起关键作用,其作为生物标志物的重要性可能与视觉处理障碍、对象识别缺陷或语义记忆障碍有关。
-
上颞回(后部分区,左侧)参与听觉处理、语言理解和语言产生,该区域的变化可能表明听觉处理障碍、语言感知困难或语言理解缺陷。
-
上顶叶小叶(右侧)与空间处理、注意力和感觉运动整合相关,该区域的改变可能与注意力缺陷、空间认知障碍或运动计划困难有关。
-
中颞回(颞枕部分,右侧)参与各种认知过程,其作为生物标志物的重要性可能与语义处理障碍、语言理解障碍或视觉和语言信息整合困难有关。
SpeCo检测
SpeCo(谱聚类和共现)检测得出以下突出区域对:右侧额顶叶(后顶叶皮质)和右侧角回、右侧中央岛盖皮质和左侧颞平面、左侧背侧注意网络(IPS)和左侧上顶叶小叶。
-
后顶叶皮质和角回参与多种认知功能。后顶叶皮质作为生物标志物的重要性可能与注意力过程、空间意识或执行功能有关,而右侧角回可能与语言相关障碍、空间认知缺陷或多感觉整合障碍有关。
-
中央岛盖皮质负责控制随意运动,该区域的异常或改变可能表明运动相关障碍或损伤。颞平面主要与听觉处理相关。作为生物标志物,颞平面的变化可能提供关于语言处理异常或听觉相关状况的见解。
-
背侧注意网络,包括顶内沟(IPS)和上顶叶小叶,参与空间注意。背侧注意网络的改变可能与空间忽视或注意力相关障碍有关。
来自两种方法的重要区域已在图10中显示。两种方法检测到的生物标志物的详细列表可在补充文件1:S4节中找到。
图10 RLF特征选择(左)和SpeCo(右)的ROIs
所有重现结果所需的代码可在补充材料中找到。
模型的可解释性
由于应用的敏感性质,通过找出这些模型在决策中主要使用的特征来使这些模型更容易理解是很重要的。
SHAP值
在基于树的机器学习方法上使用SHAP值时,发现重要的特征及其百分比贡献为:平均最短路径长度(22%)、边的数量(17%)、全局聚类(8%)、平均最短路径长度(7%)、Stoer Wagner切割(6%)和最大团(6%)。这些发现可在图11中可视化。平均最短路径长度表示信息流的效率,而边的数量反映了模型的复杂性和互连性。全局聚类揭示了分组变量的模式,而Stoer Wagner切割识别具有弱连接的子集。最大团突出显示高度互连特征的内聚组。分析这些指标通过揭示关系、识别重要特征和提高复杂模型的可解释性来增强我们的理解。
图11 SHAP特征
GNNExplainer
类似地,GNNExplainer的特征和边掩码已用于GNN模型,结果表明PageRank中心性、有效规模、贪心着色、局部到达中心性和团的数量是重要特征。PageRank中心性识别有影响力的节点,而有效规模量化信息传播能力。贪心着色有助于识别聚类,局部到达中心性揭示桥接节点。团的数量表示结构复杂性(编者注:贪心着色作为一个特征,帮助识别大脑中功能相似或相关的区域群组)。通过利用这些特征,GNN的可解释性得到提高,使我们能够更深入地理解脑图中的网络结构、有影响力的节点、信息流和潜在关系。
讨论
表征功能网络的最优二值化阈值
此外,为确定哪个二值化图的阈值保留了最多与分类目的相关的信息,本研究还通过考虑9个不同的二值化阈值并对其进行比较,强调了对受试者的分类。这些阈值的起始值被设为0.0,因为它只保留图中具有正功能相关的边,从而消除了负相关的生物学解释的不确定性。本研究不再比较模型分类能力的阈值为0.3,因为超过此值的阈值显示脑图中孤立点增加,导致无法计算分类所需的图度量,这些度量要求图中没有孤立点。未来基于不具有此类先决条件的图度量的研究可以通过考虑更高的值范围上限来继续探索这些阈值。
机器学习模型和GNN(图神经网络)的比较
在比较图神经网络和机器学习模型时,除决策树外,每个机器学习模型都显示出特异性和敏感性之间的权衡,而GNN能够在两者之间取得平衡。此外,GNN显示的标准差,特别是在敏感性和精确度方面,低于机器学习模型显示的标准差。一个可能的原因是GNN模型的复杂性质及其因此而来的更高表达能力允许以更平衡的方式对数据进行分类。另一个原因可能是GNN使用的局部特征与图的组合所捕获的信息与机器学习模型使用的全局特征之间的差异。目前,DGCNN(深度图卷积神经网络)模型略优于GCN模型,这可能归功于其更深的架构和独特的排序池化技术,能够更好地捕捉数据的拓扑复杂性。虽然目前机器学习和GNN(图神经网络)模型的性能相当,但过去的文献表明需要更大量的数据来充分训练图神经网络模型。因此,获取更多的fMRI数据有可能改善GNN性能。
精神分裂症的生物标志物
在我们寻找潜在生物标志物的努力中,我们发现一些我们发现的脑区与当前文献一致,而其他一些则不太常见。研究[44,45,46]报告了额顶区的断开连接,我们也发现这是一个重要区域。颞回(上、下)也被广泛引用为精神分裂症的重要生物标志物,在我们的研究中,我们发现下颞回和上颞回是精神分裂症检测的重要贡献因素。颞平面在我们的研究中也被发现是一个重要区域,几项研究也报告了相同结果引文[49, 51, 52]。由于我们的方法检测到了几个先前被证实有助于精神分裂症检测的生物标志物,对我们的方法检测到的其他尚未被先前研究强调的区域进行进一步调查可能是值得的。