首页 > 论文范文 > 自然科学论文 > 数学论文 > 概率论论文 > 探究AD脑结构特征提取和分类研究中独立成分分析和支持向量机的应用

探究AD脑结构特征提取和分类研究中独立成分分析和支持向量机的应用

2020-07-09 356 上传者：管理员

摘要：目的：采用数据驱动的自适应方法进行脑区划分，寻找反映AD-轻度认知障碍（MCI）-正常（NC）人群脑结构差异的特征性脑区，比较新的脑区划分方法与既有脑区划分模板在机器学习中识别三类人群的效能。方法：收集ADNI数据库中AD(151人）、MCI(124人）、NC(171人）三类人群的磁共振脑结构像，经过基于体素的形态学方法(VBM)处理后使用基于来源的形态学方法（SBM）分析输出脑区划分结果，与两份既有脑区划分模板（AAL-90与AAL-1024）一起，将脑区成分作为分类特征，年龄、性别、教育年限作为控制变量引入支持向量机，对三类人群进行两两对比，采用留一法依次将单个被试作为测试集，其余该对比中的被试作为训练集，记录并比较分类结果。结果：基于SBM的成分进行的特征提取的敏感性、特异性和总准确率方面均优于另外两种方法。在统计意义上，基于SBM方法的分类ROC曲线的AUC值均显著高于其它两种方法，体现了更好的分类效果。结论：本研究采用数据驱动的自适应脑区特征识别与划分方法，得到了新的脑区划分结果，在SVM分类器应用中观察到了对比既有脑区划分模板更高的准确性与敏感性结果。这些发现有助于AD及MCI人群与健康人群的鉴别，从而为AD早期诊断与干预提供帮助。

关键词：
AD
AD脑结构特征
支持向量机
概率论
独立成分分析
加入收藏

阿尔茨海默病是一种常见于中老年人群的神经退行性疾病，起病隐匿，病程难以逆转且缺乏有效治疗方法。其防治的重点在于早期发现并采取干预措施[1,2,3]。影像检查尤其是磁共振技术，由于其无辐射、分辨率高、多层次成像的优点，成为了AD早期诊断的理想选择[4,5]。

AD的典型脑结构改变是从内侧颞叶开始逐渐扩展到全脑的组织和皮质萎缩[6]。长期大量针对AD皮质萎缩的脑部影像学研究，提示不同脑区脑萎缩指标作为特征在阿尔茨海默病及其早期阶段诊断中的重要意义[7,8,9]。但许多以往的AD影像研究在脑萎缩特征提取时通常依靠既有的脑模板[10,11]，这些先验模板通常无法针对性的提取阿尔茨海默病发展中细微区域的结构变化。以体素水平的体积测量结果作为特征则需要大量计算资源，且容易发生过拟合现象[12]。本研究使用“基于源分析的形态学测量”方法[13]，利用数据驱动的自适应脑区划分方法，通过对AD患者、轻度认知障碍患者及正常对照人群的脑结构磁共振图像进行特征提取，并采用机器学习的方法对给定数据进行分类。比较本研究中获得的特征提取方式与其它基于既有脑模板的分类效力，验证其在AD、MCI、NC人群鉴别分类中的性能。寻找能反映和区分AD发展中脑结构变异的潜在的新影像学特征。

1、方法

1.1被试数据收集

本研究数据主要来自于网络数据库ADN。ADNI数据库于2004年建立，长期以来收录了大量AD研究中获得的影像数据及各受试者的病史、问卷调查、临床检查等研究资料，为AD的影像学研究提供了丰富的数据来源。本研究从ADNI数据库（ADNI-1、ADNI-2、ADNI-3、ADNI-GO）中经过筛选获取了574份结构磁共振影像数据。数据筛选具体采用如下标准：1.被试影像包含MPRAGE图像，层厚1.2mm或1.0mm，分辨率1.0mm1.0mm;2.被试年龄在60岁至80岁之间；3.若单个被试先后进行了多次磁共振检查，则选取其最早进行的磁共振检查数据。其中部分被试由于图像质量不符要求（114名）与控制年龄变量（14名）的要求在初步分析与预处理阶段被排除，最终进入后续研究的受试者数为446人，受试者数据概况见表1。

1.2基于体素的形态学分析（VBM)

所有被试的结构磁共振图像首先都经过VBM处理，以获取每个被试的灰质体积分布图。数据处理使用SPM12内的VBM8进行。图像被转换至标准MNI空间，并分割为灰质、白质和脑脊液概率及体积图。结果重采样至1.51.51.5mm3。对标准空间的灰质体积图以6mmFWHM进行平滑化处理，所得结果用于后续形态学分析。

表1被试基本信息统计

*对性别使用卡方检验，对其它变量使用ANOVA分析

1.3基于源分析的形态学测量（SBM)

基于源分析的形态学测量，主要基于独立成分分析算法。ICA可以从来自多个不同信号源信号组成的混杂信号中将各信号源发出的信号分离出来，已在工程领域得到广泛应用。以往ICA被用于脑功能的群组或个体源分析的成分提取[14]。这里我们假设，ICA可以提取出AD、MCI、NC被试结构图像的模式变异，得出的独立成分可以反映AD发展过程中脑体积的个体差异。因此，这些独立成分可以在降低特征维度的前提下，尽可能的保留AD、MCI、NC被试，结构图像的个体差异信息，更好的用于进一步的图像分析和分类。

SBM分析使用GIFT工具箱进行。首先，由于并非所有图像扫描范围都涵盖小脑，本研究在原灰质体积图上使用去除小脑的脑蒙板，然后所有灰质体积图被引入至4D磁共振图。在SBM处理中，空间维度（x,y,z）被转换为单一维度，如此整个数据被转换成为mn的矩阵D，其中m为蒙板范围内的像素数，n为受试者数量（446）。该矩阵经由ICA解构为混合矩阵M与源矩阵S，矩阵D等于二者的相乘。kn的混合矩阵M包含了各被试的大脑各成分的ICA分数，而mk的源矩阵S则包含着各成分中各像素的ICA分数，这些像素都可以在原大脑图像上的像素中找到其定位，绘制出k空间图像。在本研究中，k由GIFT工具根据Akaike信息准则进行估计得到的结果是20个，因此得到了划分出的20个脑区成分，用数字1至20标明，具体脑区信息见图1。

1.4基于已有模板的脑体积特征提取

本研究中应用两个先验模板提取脑结构特征，作为基于SBM方法的对照。其中，解剖结构自动标记模板将大脑灰质区域分为90个分区[15]。同时采用AAL-1024模板将全脑分成1024个脑区。分别应用这两个模板提取全脑90个和1024个脑区的体积作为形态学特征，并和20个SBM获得的成分一起分别进行支持向量机分类。

本研究中，我们分别对AAL90模板的90个脑区体积，AAL1024模板的1024个脑区体积，和基于SBM的20个成分所代表的体积分别作为待训练的数据特征，并将年龄、性别和教育年限作为控制变量。

本研究使用matlab中SVM工具箱验证SBM分析所得脑区成分在被试者分类中的作用，采用留一法（leave-oneout），即依次将每个被试单独作为测试集，其余所有属于该对比组的被试作为分类器形成所用的训练集，记录每次测试中分类器对测试集数据分类的准确性、敏感性、特异性及工作曲线（ROC）。并基于DeLong方法，对ROC的曲线下面积（AUC）进行统计比较。

对SBM分类，我们统计了20个成分在SVM下分类权重。通过进行了1000次置换检验，统计随机置换检验中大于前5%的分类权重绝对值作为显著性标准（p<0.05）。

2、结果

2.1基于ICA的脑区划分结果

通过SBM分析，我们共得到20个独立成分表达AD、MCI、NC群体的所有被试的个体体积差异。其对应的空间模式在全脑的位置在图1中标明（Z>2.0）。

2.2支持向量机分类结果

在三组受试者进行的两两比较（MCI与AD、AD与NC及MCI与NC）中，SBM方法的诊断准确性分别为0.7153、0.8168与0.6982，均高于AAL90方法（0.6407、0.7857与0.5818）与AAL1024方法（0.6780、0.7919与0.6109）；在诊断敏感性上，SBM方法为（0.8129、0.8830与0.6532），同样高于AAL90方法（0.7018、0.8070与0.5403）与AAL1024方法（0.7427、0.8129与0.5645）；在诊断特异性方面，SBM方法在MCI与AD、AD与NC组表现为0.5806与0.7417，略低于AAL90方法（0.5565与0.7616）与AAL1024方法（0.5887与0.7682），在MCI与NC组中表现则为0.7351，同样高于AAL90(0.6159）与AAL1024(0.6490）两者，见表2。

图1基于源分析的形态学方法获取的20个空间成分

2.3ROC曲线

本研究单独根据采用各个脑区划分方法的分类结果绘制了ROC曲线图，横轴表示假阳性率（等于1-特异性），纵轴则表示真阳性率（等于敏感性）。其中AUC代表了正确分类的效能。SBM方法在MCI与AD、MCI与NC及AD与NC三组比较中的AUC值分别为0.7471、0.7623和0.8904，均高于AAL90方法（0.6234、0.6798与0.8566）与AAL1024方法（0.6258、0.6813与0.8516），后二者与SBM方法AUC值的差异均具有统计学意义（P<0.05），见图2。

2.4分类权重

如图3所示。在基于SBM的分类器中，区分AD和NC组主要依赖于成分7、8、9，包括海马和内侧颞叶（7）、内侧枕叶-梭状回区域（8）及外侧颞下回（9）等区域。但区分MCI和NC则具有显著分类权重的成分为6、7、8、14，即额下回及眶额皮质（6）、外侧额上回（14），海马和内侧颞叶（7）。区分MCI和AD时显著成分则分布较广，包括了6、7、8、11、12、19、20等包含了额下回及眶额皮质（6）、海马及内侧颞叶（7）、内侧枕叶-梭状回（8）、颞枕叶皮质（11,12）、顶叶（19）和内侧枕叶（20）等非常广泛的区域。

表2基于SBM和两种先验模板进行特征提取时的支持向量机分类结果

图2三种不同特征提取方法的支持向量机分类的ROC曲线。其中AAL90和AAL1024的AUC在三种不同分类中均和SBM方法具有显著差异（p<0.05）。

图3SBM提取的20个特征在三种不同分组进行分类时支持向量机所分配的权重。图中横坐标表示每个SBM提取的特征，编号和图1相一致。纵坐标为SVM中对这一特征在三种分类（AD-MCI,AD-NC和MCI-NC）时所分配的权重。

3、讨论

本研究对采用不同脑区划分方式，分别进行SVM分类，对AD、MCI、NC人群分类的准确性、敏感性与特异性进行了统计。从统计数据来看，基于SBM成分进行的特征提取较另外两种既有脑区划分在分类表现上具有明显优势。具体而言，除在MCI对NC及AD对NC的两组对比的特异性上SBM方法略低于其它组（但AUC值差异不具有显著性）之外，其余所有分类中，SBM方法从敏感性、特异性和总准确率方面均优于另外两种方法。在ROC统计上，基于SBM方法的AUC值均显著高于其它两种方法，体现了更好的分类效果。

经过这些实验本研究得到了一些值得讨论的结果，首先是SBM分类方法，作为本研究采用的数据驱动、自适应的脑区划分方法，其提取的20个特征性脑体积成分在SVM分类测试中的表现优于已有的AAL90与AAL1024脑区划分法。这证实了通过SBM进行的特征提取在探究AD病理过程中不同脑区作用上相对先验脑区划分方法具有更高潜力。具体而言，在区分AD和NC组时，三种方法均可达到较高的准确率及分类AUC。对此一种经验性的解释是AD人群与NC人群的脑结构差距最为明显，大部分常见的特征提取和分类算法都足以捕捉到这种差异，使得三者在正确性上均有较高表现。而对MCI与NC或AD进行区分时，SBM则显著优于另外两种方法，说明这一方法在针对更加细微和复杂的差异，如对早期AD的诊断，较先验脑区划分方法具有更明显优势。同时，基于SBM方法处理，用于SVM训练的特征数目较少，比起ALL90或者ALL1024模板的几十乃至上千个特征，甚至直接基于体素的数万和数十万的特征数目，有效规避了可能出现特征维度大于样本维度带来的过拟合问题。SBM方法在未来研究中用于特征提取可能具有更大的潜力。

在SBM分类器中，我们发现区分AD和NC主要依靠海马、内侧颞叶及附近皮质的体积特征。但区分MCI和NC时则额下回及眶额皮质、内侧枕叶和梭状回区域表现出较高的权重，提示这些区域在MCI早期代偿过程中发挥了一定的作用。而MCI-AD的分类器具有显著权重的成分包含了包括额叶、枕叶、顶叶在内的大量脑区，可能说明MCI发展到AD过程中全脑性的萎缩特征。这与以往的研究是相符的[16,17,18]，说明这种广泛分布的脑萎缩特征对从MCI发展到AD过程的区分和诊断具有一定的意义。

综上，本研究通过数据驱动的自适应脑区特征识别与划分方法，得到了不同于先验脑区划分模板的新的脑区划分结果，同时控制了分类特征的数量，并在SVM分类器应用中获得了更高的准确性与敏感性结果。这些发现有助于AD及MCI人群与健康人群的鉴别，从而为AD早期诊断与干预提供帮助，为AD的影像诊断提供了新的思路。

陈丰,王正阁,吴思楚,张雯,陈文倩,闫娴,孙艺,李茗,张鑫,张冰,青钊.基于独立成分分析和支持向量机的AD脑结构特征提取和分类研究[J].阿尔茨海默病及相关病,2019,2(04):504-509.

基金:国家自然科学基金(81701672,81720108022,91649116,81571040);中央高校基本科研业务基金(021414380274);江苏省社会发展科技计划(BE2016605,BE201707);南京市医学科技发展资金资助项目(Ykk16112).