摘要:目的:采用数据驱动的自适应方法进行脑区划分,寻找反映AD-轻度认知障碍(MCI)-正常(NC)人群脑结构差异的特征性脑区,比较新的脑区划分方法与既有脑区划分模板在机器学习中识别三类人群的效能。方法:收集ADNI数据库中AD(151人)、MCI(124人)、NC(171人)三类人群的磁共振脑结构像,经过基于体素的形态学方法(VBM)处理后使用基于来源的形态学方法(SBM)分析输出脑区划分结果,与两份既有脑区划分模板(AAL-90与AAL-1024)一起,将脑区成分作为分类特征,年龄、性别、教育年限作为控制变量引入支持向量机,对三类人群进行两两对比,采用留一法依次将单个被试作为测试集,其余该对比中的被试作为训练集,记录并比较分类结果。结果:基于SBM的成分进行的特征提取的敏感性、特异性和总准确率方面均优于另外两种方法。在统计意义上,基于SBM方法的分类ROC曲线的AUC值均显著高于其它两种方法,体现了更好的分类效果。结论:本研究采用数据驱动的自适应脑区特征识别与划分方法,得到了新的脑区划分结果,在SVM分类器应用中观察到了对比既有脑区划分模板更高的准确性与敏感性结果。这些发现有助于AD及MCI人群与健康人群的鉴别,从而为AD早期诊断与干预提供帮助。
阿尔茨海默病是一种常见于中老年人群的神经退行性疾病,起病隐匿,病程难以逆转且缺乏有效治疗方法。其防治的重点在于早期发现并采取干预措施[1,2,3]。影像检查尤其是磁共振技术,由于其无辐射、分辨率高、多层次成像的优点,成为了AD早期诊断的理想选择[4,5]。
AD的典型脑结构改变是从内侧颞叶开始逐渐扩展到全脑的组织和皮质萎缩[6]。长期大量针对AD皮质萎缩的脑部影像学研究,提示不同脑区脑萎缩指标作为特征在阿尔茨海默病及其早期阶段诊断中的重要意义[7,8,9]。但许多以往的AD影像研究在脑萎缩特征提取时通常依靠既有的脑模板[10,11],这些先验模板通常无法针对性的提取阿尔茨海默病发展中细微区域的结构变化。以体素水平的体积测量结果作为特征则需要大量计算资源,且容易发生过拟合现象[12]。本研究使用“基于源分析的形态学测量”方法[13],利用数据驱动的自适应脑区划分方法,通过对AD患者、轻度认知障碍患者及正常对照人群的脑结构磁共振图像进行特征提取,并采用机器学习的方法对给定数据进行分类。比较本研究中获得的特征提取方式与其它基于既有脑模板的分类效力,验证其在AD、MCI、NC人群鉴别分类中的性能。寻找能反映和区分AD发展中脑结构变异的潜在的新影像学特征。
1、方法
1.1被试数据收集
本研究数据主要来自于网络数据库ADN。ADNI数据库于2004年建立,长期以来收录了大量AD研究中获得的影像数据及各受试者的病史、问卷调查、临床检查等研究资料,为AD的影像学研究提供了丰富的数据来源。本研究从ADNI数据库(ADNI-1、ADNI-2、ADNI-3、ADNI-GO)中经过筛选获取了574份结构磁共振影像数据。数据筛选具体采用如下标准:1.被试影像包含MPRAGE图像,层厚1.2mm或1.0mm,分辨率1.0mm1.0mm;2.被试年龄在60岁至80岁之间;3.若单个被试先后进行了多次磁共振检查,则选取其最早进行的磁共振检查数据。其中部分被试由于图像质量不符要求(114名)与控制年龄变量(14名)的要求在初步分析与预处理阶段被排除,最终进入后续研究的受试者数为446人,受试者数据概况见表1。
1.2基于体素的形态学分析(VBM)
所有被试的结构磁共振图像首先都经过VBM处理,以获取每个被试的灰质体积分布图。数据处理使用SPM12内的VBM8进行。图像被转换至标准MNI空间,并分割为灰质、白质和脑脊液概率及体积图。结果重采样至1.51.51.5mm3。对标准空间的灰质体积图以6mmFWHM进行平滑化处理,所得结果用于后续形态学分析。
表1被试基本信息统计
*对性别使用卡方检验,对其它变量使用ANOVA分析
1.3基于源分析的形态学测量(SBM)
基于源分析的形态学测量,主要基于独立成分分析算法。ICA可以从来自多个不同信号源信号组成的混杂信号中将各信号源发出的信号分离出来,已在工程领域得到广泛应用。以往ICA被用于脑功能的群组或个体源分析的成分提取[14]。这里我们假设,ICA可以提取出AD、MCI、NC被试结构图像的模式变异,得出的独立成分可以反映AD发展过程中脑体积的个体差异。因此,这些独立成分可以在降低特征维度的前提下,尽可能的保留AD、MCI、NC被试,结构图像的个体差异信息,更好的用于进一步的图像分析和分类。
SBM分析使用GIFT工具箱进行。首先,由于并非所有图像扫描范围都涵盖小脑,本研究在原灰质体积图上使用去除小脑的脑蒙板,然后所有灰质体积图被引入至4D磁共振图。在SBM处理中,空间维度(x,y,z)被转换为单一维度,如此整个数据被转换成为mn的矩阵D,其中m为蒙板范围内的像素数,n为受试者数量(446)。该矩阵经由ICA解构为混合矩阵M与源矩阵S,矩阵D等于二者的相乘。kn的混合矩阵M包含了各被试的大脑各成分的ICA分数,而mk的源矩阵S则包含着各成分中各像素的ICA分数,这些像素都可以在原大脑图像上的像素中找到其定位,绘制出k空间图像。在本研究中,k由GIFT工具根据Akaike信息准则进行估计得到的结果是20个,因此得到了划分出的20个脑区成分,用数字1至20标明,具体脑区信息见图1。
1.4基于已有模板的脑体积特征提取
本研究中应用两个先验模板提取脑结构特征,作为基于SBM方法的对照。其中,解剖结构自动标记模板将大脑灰质区域分为90个分区[15]。同时采用AAL-1024模板将全脑分成1024个脑区。分别应用这两个模板提取全脑90个和1024个脑区的体积作为形态学特征,并和20个SBM获得的成分一起分别进行支持向量机分类。
本研究中,我们分别对AAL90模板的90个脑区体积,AAL1024模板的1024个脑区体积,和基于SBM的20个成分所代表的体积分别作为待训练的数据特征,并将年龄、性别和教育年限作为控制变量。
本研究使用matlab中SVM工具箱验证SBM分析所得脑区成分在被试者分类中的作用,采用留一法(leave-oneout),即依次将每个被试单独作为测试集,其余所有属于该对比组的被试作为分类器形成所用的训练集,记录每次测试中分类器对测试集数据分类的准确性、敏感性、特异性及工作曲线(ROC)。并基于DeLong方法,对ROC的曲线下面积(AUC)进行统计比较。
对SBM分类,我们统计了20个成分在SVM下分类权重。通过进行了1000次置换检验,统计随机置换检验中大于前5%的分类权重绝对值作为显著性标准(p<0.05)。
2、结果
2.1基于ICA的脑区划分结果
通过SBM分析,我们共得到20个独立成分表达AD、MCI、NC群体的所有被试的个体体积差异。其对应的空间模式在全脑的位置在图1中标明(Z>2.0)。
2.2支持向量机分类结果
在三组受试者进行的两两比较(MCI与AD、AD与NC及MCI与NC)中,SBM方法的诊断准确性分别为0.7153、0.8168与0.6982,均高于AAL90方法(0.6407、0.7857与0.5818)与AAL1024方法(0.6780、0.7919与0.6109);在诊断敏感性上,SBM方法为(0.8129、0.8830与0.6532),同样高于AAL90方法(0.7018、0.8070与0.5403)与AAL1024方法(0.7427、0.8129与0.5645);在诊断特异性方面,SBM方法在MCI与AD、AD与NC组表现为0.5806与0.7417,略低于AAL90方法(0.5565与0.7616)与AAL1024方法(0.5887与0.7682),在MCI与NC组中表现则为0.7351,同样高于AAL90(0.6159)与AAL1024(0.6490)两者,见表2。
图1基于源分析的形态学方法获取的20个空间成分
2.3ROC曲线
本研究单独根据采用各个脑区划分方法的分类结果绘制了ROC曲线图,横轴表示假阳性率(等于1-特异性),纵轴则表示真阳性率(等于敏感性)。其中AUC代表了正确分类的效能。SBM方法在MCI与AD、MCI与NC及AD与NC三组比较中的AUC值分别为0.7471、0.7623和0.8904,均高于AAL90方法(0.6234、0.6798与0.8566)与AAL1024方法(0.6258、0.6813与0.8516),后二者与SBM方法AUC值的差异均具有统计学意义(P<0.05),见图2。
2.4分类权重
如图3所示。在基于SBM的分类器中,区分AD和NC组主要依赖于成分7、8、9,包括海马和内侧颞叶(7)、内侧枕叶-梭状回区域(8)及外侧颞下回(9)等区域。但区分MCI和NC则具有显著分类权重的成分为6、7、8、14,即额下回及眶额皮质(6)、外侧额上回(14),海马和内侧颞叶(7)。区分MCI和AD时显著成分则分布较广,包括了6、7、8、11、12、19、20等包含了额下回及眶额皮质(6)、海马及内侧颞叶(7)、内侧枕叶-梭状回(8)、颞枕叶皮质(11,12)、顶叶(19)和内侧枕叶(20)等非常广泛的区域。
表2基于SBM和两种先验模板进行特征提取时的支持向量机分类结果
图2三种不同特征提取方法的支持向量机分类的ROC曲线。其中AAL90和AAL1024的AUC在三种不同分类中均和SBM方法具有显著差异(p<0.05)。
图3SBM提取的20个特征在三种不同分组进行分类时支持向量机所分配的权重。图中横坐标表示每个SBM提取的特征,编号和图1相一致。纵坐标为SVM中对这一特征在三种分类(AD-MCI,AD-NC和MCI-NC)时所分配的权重。
3、讨论
本研究对采用不同脑区划分方式,分别进行SVM分类,对AD、MCI、NC人群分类的准确性、敏感性与特异性进行了统计。从统计数据来看,基于SBM成分进行的特征提取较另外两种既有脑区划分在分类表现上具有明显优势。具体而言,除在MCI对NC及AD对NC的两组对比的特异性上SBM方法略低于其它组(但AUC值差异不具有显著性)之外,其余所有分类中,SBM方法从敏感性、特异性和总准确率方面均优于另外两种方法。在ROC统计上,基于SBM方法的AUC值均显著高于其它两种方法,体现了更好的分类效果。
经过这些实验本研究得到了一些值得讨论的结果,首先是SBM分类方法,作为本研究采用的数据驱动、自适应的脑区划分方法,其提取的20个特征性脑体积成分在SVM分类测试中的表现优于已有的AAL90与AAL1024脑区划分法。这证实了通过SBM进行的特征提取在探究AD病理过程中不同脑区作用上相对先验脑区划分方法具有更高潜力。具体而言,在区分AD和NC组时,三种方法均可达到较高的准确率及分类AUC。对此一种经验性的解释是AD人群与NC人群的脑结构差距最为明显,大部分常见的特征提取和分类算法都足以捕捉到这种差异,使得三者在正确性上均有较高表现。而对MCI与NC或AD进行区分时,SBM则显著优于另外两种方法,说明这一方法在针对更加细微和复杂的差异,如对早期AD的诊断,较先验脑区划分方法具有更明显优势。同时,基于SBM方法处理,用于SVM训练的特征数目较少,比起ALL90或者ALL1024模板的几十乃至上千个特征,甚至直接基于体素的数万和数十万的特征数目,有效规避了可能出现特征维度大于样本维度带来的过拟合问题。SBM方法在未来研究中用于特征提取可能具有更大的潜力。
在SBM分类器中,我们发现区分AD和NC主要依靠海马、内侧颞叶及附近皮质的体积特征。但区分MCI和NC时则额下回及眶额皮质、内侧枕叶和梭状回区域表现出较高的权重,提示这些区域在MCI早期代偿过程中发挥了一定的作用。而MCI-AD的分类器具有显著权重的成分包含了包括额叶、枕叶、顶叶在内的大量脑区,可能说明MCI发展到AD过程中全脑性的萎缩特征。这与以往的研究是相符的[16,17,18],说明这种广泛分布的脑萎缩特征对从MCI发展到AD过程的区分和诊断具有一定的意义。
综上,本研究通过数据驱动的自适应脑区特征识别与划分方法,得到了不同于先验脑区划分模板的新的脑区划分结果,同时控制了分类特征的数量,并在SVM分类器应用中获得了更高的准确性与敏感性结果。这些发现有助于AD及MCI人群与健康人群的鉴别,从而为AD早期诊断与干预提供帮助,为AD的影像诊断提供了新的思路。
陈丰,王正阁,吴思楚,张雯,陈文倩,闫娴,孙艺,李茗,张鑫,张冰,青钊.基于独立成分分析和支持向量机的AD脑结构特征提取和分类研究[J].阿尔茨海默病及相关病,2019,2(04):504-509.
基金:国家自然科学基金(81701672,81720108022,91649116,81571040);中央高校基本科研业务基金(021414380274);江苏省社会发展科技计划(BE2016605,BE201707);南京市医学科技发展资金资助项目(Ykk16112).
分享:
教学不仅是传授知识,更重要的是启智,为学生多打开几扇窗;此外,数学是一个整体,概率与现实世界关系紧密,因而是可以让学生结合所学内容做一些相关性研究课题的,譬如Berkerley大学统计系DavidAldous的创新性课程ProbabilityandRealWorld就是结合现实问题以分组课题研究形式来开展的.
2021-01-21在实分析、测度论、高等概率论等课程中,示性函数处处可见,是构造简单函数,逼近一般可测函数的基石.虽然学生在学习高等数学初期就会了解的著名的Dirichlet函数就是有理数集的示性函数,但遗憾的是,在教学中,特别是在初等概率论教学中,示性函数的作用没有得到应有的充分重视.有的教材对示性函数仅作简单应用[5],有的教材则对示性函数避而不谈。
2021-01-20《概率论与数理统计》是高等学校的基础课程,难度较大,需要较强的逻辑思维能力。另外,《概率论与数理统计》这门课知识点众多,应用场景也较多,如何较好地掌握书中的定理和定义是研究的重中之重。针对《概率论与数理统计》的教学中容易出现的诸多问题,以条件概率、全概率公式和极大似然公式为例;引入了互联网公司的就业要求以增强学生的学习意识,加强定理定义分解以改善学生对定理死记硬背的现象,增添趣味案例简化学生学习定理时的难度。
2020-12-29“穿越沙漠”游戏规定为:每名玩家在游戏开始时都会收到一定数额的资金与闯关地图,分别用来购买行进过程中必要的生活用品和规划全局路线,途中经过村庄可以用来补给资源,经过矿山并采矿能获得固定资金,玩家在探险途中还可能会遇到恶劣天气。在系统指定的时间内从起点处穿越沙漠到达终点即为通过,剩余的资金与资源越丰富获得优胜的机会越大。
2020-11-27大学数学课程是指概率论与数理统计、微积分与线性代数等一类课程,在高等教育教学中占据极为重要的地位。其中概率论与数理统计由于它的知识体系、课程性质等特点,使其具有开展思政教学改革的良好基础和明显优势。因此,本文以概率论与数理统计为对象,研究如何深入有效地开展大学数学课程思政建设,探索实施路径和有效方法。
2020-09-09本文首先用K-Means聚类算法对寿险客户进行价值细分,获得不同价值类别的客户;其次建立Logistic二分类模型进行客户流失预测,并比较细分前、细分后的预测效果。本文提出的方法,可以帮助寿险公司从宏观上预测客户流失的人数,从微观上判断客户的状态,为寿险行业的客户保留提供可行建议。
2020-09-09岩性识别是地质研究过程中非常重要的基础工作,尤其是在近地表以及深部无法直接采样区的地质研究中,准确地刻画深部岩石类型及其结构关系,可以为能源矿产勘探、深部结构与构造等研究提供重要的地质信息。因此采用什么数据、什么方法来进行岩性识别是一项极具价值的研究工作。
2020-08-10骰子模型有着广泛的应用.[1,2,3,4]苏有菊和魏首柳应用列举法、生成函数方法、母函数法、组合数法给出了投掷次数为2次或3次,点数之和为7或9时概率的具体计算例子.[5,6]本文将对生成函数法展开深入探讨,给出一个结构优美的计算公式,进一步给出任意面体的推广“骰子”,在n次投掷后的点数之和为m的概率计算公式.
2020-08-10本研究使用“基于源分析的形态学测量”方法[13],利用数据驱动的自适应脑区划分方法,通过对AD患者、轻度认知障碍患者及正常对照人群的脑结构磁共振图像进行特征提取,并采用机器学习的方法对给定数据进行分类。比较本研究中获得的特征提取方式与其它基于既有脑模板的分类效力,验证其在AD、MCI、NC人群鉴别分类中的性能。寻找能反映和区分AD发展中脑结构变异的潜在的新影像学特征。
2020-07-09文中介绍了因果推论到直接效应和间接效应的相关概念,针对中介有多个的情况,引用了Baron和Kenny(1986)与TylerJ.VanderWeele和Vansteelandt.的中介模型,建立多中介变量模型,并重新定义了多中介变量模型的直接效应和间接效应的概念。利用新建立的多中介变量模型对直接效应和间接效应进行模拟研究,在估计直接效应和间接效应时,采用了不同的方法进行模拟。
2020-07-08人气:3686
人气:2130
人气:1787
人气:1781
人气:1658
我要评论
期刊名称:数学的实践与认识
期刊人气:1866
主管单位:中国科学院
主办单位:中国科学院数学与系统科学研究院
出版地方:北京
专业分类:科学
国际刊号:1000-0984
国内刊号:11-2018/O1
邮发代号:2-809
创刊时间:1971年
发行周期:半月刊
期刊开本:16开
见刊时间:1年以上
影响因子:0.553
影响因子:0.322
影响因子:0.352
影响因子:0.000
影响因子:0.000
400-069-1609
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!