首页 > 论文范文 > 医药卫生论文 > 影像检验论文 > PET/CT论文 > 基于机器学习预测儿童腹盆部CT器官剂量的可行性研究

基于机器学习预测儿童腹盆部CT器官剂量的可行性研究

2025-04-09 83 上传者：管理员

摘要：目的探究机器学习方法用于预测儿童腹盆部CT器官剂量的可行性｡方法回顾性搜集于天津市儿童医院接受腹盆部CT平扫的3415例患儿图像,选择年龄､性别､CT容积剂量指数(CTDIvol)､扫描长度､剂量长度乘积(DLP)和体型特异性剂量估计(SSDE)等六种特征,分别使用支持向量机(SVM)､决策树(DT)､随机森林(RF)和K近邻(KNN)等算法预测个体器官剂量,比较四种模型的性能｡利用权重系数和Shapley加法解释(SHAP)确定每个特征对模型的贡献程度｡结果RF整体性能最优,其平均绝对误差､平均绝对百分比误差､均方误差､均方根误差､Pearson相关系数(r)和决定系数(R2)分别为1.6341､0.0218､7.3453､2.7102､0.9671(P<0.001)和0.9330｡SSDE对于模型预测贡献程度最高,与预测值为正相关;年龄贡献度仅次于SSDE,与预测值为负相关｡结论临床工作中可使用基于SSDE等指标构建的机器学习模型准确快捷地估测个体器官剂量｡

关键词：
体型特异性剂量估计
儿童腹盆部CT
器官剂量
机器学习
电离辐射
加入收藏

CT扫描技术快速发展带来的相关电离辐射危害问题已不容忽略[1]｡处于生长发育期的儿童相较于成人对电离辐射更加敏感,因此亟需准确估测儿童CT检查的辐射剂量从而进一步优化CT扫描协议｡目前,基于标准人体模型得出的CT容积剂量指数(volumecomputedtomographydoseindex,CT⁃DIvol)和剂量长度乘积(dose⁃lengthproduct,DLP)仅作为CT扫描设备辐射剂量输出值,无法准确反映患儿实际接受的辐射剂量[2]｡美国物理师协会(a⁃mericanassociationofphysicistinmedicine,AAPM)在2011年和2014年先后提出采用有效直径(effectivediameter,ED)与水等效直径(waterequivalentdiame⁃ter,WED)修正体型和组织衰减对CTDIvol影响的体型特异性剂量估计(size⁃specificdoseestimate,SS⁃DE)方法[3,4]｡近年来,有研究提出个体器官剂量可能会更加准确地评估受检者辐射风险[5],并且一些研究分别报道了CTDIvol､DLP和SSDE与器官剂量间的关联[6~9]｡目前MonteCarlo模拟器可以为患者个体化器官剂量测定提供最为准确的估计值[10],并且通常被认为是不同评估方法的“金标准”,但其计算过程需要相关的硬件及软件配置,操作较复杂｡因此,本研究拟探究基于SSDE､CTDIvol等指标构建的机器学习模型用于预测儿童腹盆部CT扫描中器官剂量的可行性,尝试为进一步在日常工作中快速准确地预测个体器官剂量提供一定的理论支持和实践指导｡

1、资料与方法

1.1临床资料

回顾性搜集并分析天津市儿童医院2022年7月至2023年12月接受腹盆部CT平扫的患儿3415例的资料,其中男1855例(54.32%),女1560例(45.68%),年龄1.5~17.8岁,中位年龄(8.5±5.3)岁｡排除标准:金属伪影或肠蠕动伪影过重导致图像质量较差无法满足诊断要求或可能导致辐射剂量计算不准的病例｡本研究通过天津市儿童医院伦理委员会批准｡

1.2扫描方案

所有病例均采用荷兰Philips公司128排Bril⁃lianceiCT进行检查｡患儿取仰卧位,头先进,摄正位定位像,扫描基线为膈顶,扫描范围膈顶至耻骨联合下缘,可以配合的患儿在扫描过程中嘱其屏气,无法配合的患儿口服水合氯醛(0.5ml/kg体重)镇静后再行扫描｡扫描方案中管电压和管电流根据患儿体重设置[11]:10~19kg:100kV,52mAs;20~29kg:120kV,40mAs;30~39kg:120kV,43mAs;40~49kg:120kV,50mAs;50kg以上:120kV,61mAs｡螺旋扫描方式成像,球管旋转时间0.33s,螺距0.993mm,采集矩阵512×512,重组层厚为5mm,层间隔5mm,重组矩阵512×512｡

1.3SSDE与器官剂量计算

通过Radimetrics(RadimetricsInc,Bayer)软件对患儿的CT平扫数据进行分析,根据轴位图像或者定位像计算患儿WED,通过WED推算SSDE｡本研究基于MonteCarlo模拟计算得到的器官剂量作为标准参考值:利用Radimetrics平台的标准数字化人体模型库,基于年龄性别等将患儿映射至对应的数学体模,估算器官的吸收剂量(D)｡由于X线的辐射权重因子为1,即对于不同的器官k,其器官当量剂量(H)为:Hk=Dk(1)本研究中的器官剂量为腹盆部扫描范围内主要曝光器官总剂量,包括肝脏､胆囊､胃､脾､胰腺､肾上腺､肾､结肠､小肠､大肠､膀胱､卵巢､子宫､睾丸等[12],按照以下公式计算为:ODG=∑WkHK(2)其中Wk代表组织权重因子｡

1.4机器学习分析

本研究机器学习分析过程均基于Matlab软件平台(R2024a)及MVPANI(MultivariatePatternAnal⁃ysisofNeuroimagingData)软件[13]完成｡根据先验知识,本研究使用年龄､性别､CTDIvol､扫描长度､DLP以及SSDE等六种与器官剂量相关的特征作为机器学习模型的输入变量,以器官剂量值为输出变量｡本研究选用支持向量机(supportvectorma⁃chine,SVM)､决策树(decisiontree,DT)､随机森林(randomforest,RF)和K近邻(k⁃nearestneighbor,KNN)等机器学习方法建立四种预测模型｡为了强化模型的泛化能力,本研究采用十折交叉验证的方法:将所有数据均分为十折,依次选取一折数据作为测试集,其余九折数据作为训练集,综合十次结果可得到每个样本的预测值｡采用平均绝对误差(meanabsoluteerror,MAE)､平均绝对百分比误差(meanabsolutepercentageer⁃ror,MAPE)､均方误差(meansquarederror,MSE)､均方根误差(rootmeansquarederror,RMSE)､Pearson相关系数(r)以及决定系数(R2)等衡量四种模型的预测性能｡为了评估不同特征变量对模型预测能力的贡献程度,针对SVM模型,每个特征最终的权重系数为该特征在全部预测模型中十个权重系数的均值,该值可以用来评估每个特征对于SVM模型预测结果的贡献度;针对DT､RF和KNN模型,本研究通过Shapley加法解释(Shapleyadditiveexplanation,SHAP)对模型的预测结果进行解释｡

1.5统计学分析

本研究均使用Matlab(R2024a)及GraphPadPrism(8.0.2)软件进行统计分析｡使用Shapiro⁃Wilk检验对计量资料进行正态性检验｡符合正态分布的计量资料用平均数±标准差(x±s)表示,非正态分布的计量资料用中位数(四分位数间距)表示｡计数资料采用例数(%)表示｡Pearson相关系数的统计显著性均使用置换检验确定:随机排列训练组标签1000次,每次可获得一个器官剂量预测值与真实值的Pearson相关系数,最终可获得1000个随机相关系数｡1000个随机相关系数构成一个零分布,计算比真实值更大的随机相关系数的排列次数,用该排列次数除以置换次数即可得到置换检验的P值｡P<0.05为差异有统计学意义｡

2、结果

2.1一般资料

本研究共纳入研究对象3415例,一般统计学结果:CTDIvol为(2.9±0.7)mGy,DLP为(115.6±51.7)mGy·cm,扫描长度为(360±90)mm,SSDE为(5.80±0.80)mGy,扫描范围内器官总剂量为(75.02±11.81)mSv｡

2.2四种模型预测性能评价

综合六种评价指标,本研究中RF模型整体预测性能最好(该模型MSE为7.3453,RMSE为2.7102,r为0.9671,R2为0.9330,均优于其他3种模型;MAE和MAPE分别为1.6341､0.0218,略次于DT模型,远优于其他两种模型)｡真实器官剂量与四种模型预测结果的Pearson相关系数以及统计学显著性(表1,图1)｡

2.3模型解释与可视化

针对SVM模型(图2A),6个特征的平均权重值从高到低依次为:CTDIvol､SSDE､性别､年龄､DLP､扫描长度｡其中,CTDIvol､SSDE权重大小远远高于其他特征,且与SVM预测结果呈正相关｡针对DT､RF及KNN模型(图2B~D),每种模型的6个特征按照对预测结果的贡献程度递减排序｡DT和RF模型贡献度最高的两个特征依次为SSDE与年龄,KNN模型贡献度最高的两个特征为DLP与扫描长度｡图3A~C依次为DT､RF及KNN3种模型的SHAP值汇总图｡SHAP值汇总图中每行代表一个特征,每个点代表一个样本,点在横轴上的位置表示该特征的SHAP值,>0表示对预测结果产生正向影响,反之产生负向影响;点的颜色越红表示特征本身数值越大,颜色越蓝表示数值越小｡DT和RF模型的SHAP值汇总图(图3A､B)基本一致,SSDE贡献程度最高,且大部分红点分布在SHAP值大于0的区域,因此较大的SSDE值对于模型预测结果有正向作用,即SSDE值与预测值为正相关;而年龄作为第二重要的特征变量,大部分红点分布在SHAP值小于0的区域,因此较大的年龄对于模型预测存在反向影响,即年龄与预测值为负相关｡KNN模型的SHAP值汇总图(图3C)显示DLP值与预测器官剂量值为正相关,而扫描长度与之相反｡KNN模型特征的重要性排序与DT和RF模型差异较大｡

表1不同机器学习模型预测准确率比较

图1A~D真实器官剂量和四种模型预测结果的相关性图

图2A~D四种模型特征重要性排序图

图3A~C三种模型的SHAP值汇总图

3、讨论

本研究旨在通过SSDE指标联合机器学习模型为接受腹盆部CT平扫的儿科患者提供一个较为快捷准确的个体器官剂量估测值｡首先,本研究采用了年龄､性别､CTDIvol､扫描长度､DLP与SSDE等六种与器官剂量相关的特征,联合SVM､DT､RF以及KNN等算法建立了四种机器学习模型,比较了四种模型的预测性能｡其次,本研究采用特征权重系数和SHAP方法计算了四种模型中每个特征对预测结果的贡献程度｡

本研究结果表明在临床工作中利用机器学习模型可较准确快捷地估测器官剂量｡很多研究发现与SSDE相比,CTDIvol和DLP可能会低估患者接受的辐射剂量,并且随着患者的体型减小低估程度逐渐增大[14~16];相反,对于体型较大的患者,CTDIvol会高估实际接受的辐射剂量水平[14,17]｡由于儿童患者的体型差异较大,放射工作者必须要考虑体型因素导致的患儿实际接受的辐射剂量的差异,对小体型患儿避免较大剂量的照射､降低辐射风险,对大体型患儿避免过低剂量导致影像质量较差影响诊断结果｡虽然SSDE修正了体型和组织衰减对CTDIvol的影响,然而,评估暴露个体的癌症诱发概率的CT剂量表征指标是器官或组织剂量[5],因此器官剂量在放射防护工作中具有更加重要的意义｡Franck等[8]通过研究不同年龄阶段的儿童胸腹盆部CT剂量数据,表明SSDE与被完全照射的器官组织的吸收剂量存在高度线性相关,同时也指出SSDE与照射范围之外的器官剂量的相关性大大减弱;Moore等[6]通过采集不同体重的儿童胸腹盆部CT扫描数据为器官剂量估测提供简单的相关转换因子表格,发现基于SSDE的器官剂量估测值与完整处于扫描范围内部的器官组织剂量值的平均误差在10%以下;聂壮等[18]通过多重线性方程计算出SSDE和器官剂量的回归系数,提示了利用SSDE估测成人冠状动脉CT血管造影(CCTA)检查中照射范围内器官剂量的可行性｡对比一般线性模型,机器学习模型可以解决非线性回归的问题,在许多情况下可大大提高预测精度｡目前尚未有研究探索利用机器学习模型预测儿童腹盆部CT器官剂量的可行性,而本研究比较了四种机器学习模型的预测性能,结果表明综合表现最优的RF模型可以输出较为准确的器官剂量值,误差较小,相关系数和决定系数均较高,表明模型预测性能良好｡关于模型的可视化解释,本研究综合四种机器学习模型发现各个特征对模型预测结果产生影响的方向大致相同｡就最优模型RF而言,首先,SSDE､CTDIvol､DLP3个特征与预测器官剂量值为正相关并且SSDE在模型预测中的重要性远远高于其他特征,表明SSDE对于器官剂量估测贡献程度最大,这与先前诸多报道SSDE与器官剂量值之间关系的文献保持高度一致｡Gao等[19]的研究结果表明,在患者体型各异的情况下,CTDIvol本身不足以作为器官剂量的标准化因子,而SSDE用于患者器官剂量估计时更加普遍适用｡该研究同时表明,将DLP转换为个体有效剂量的标准化因子会随着患者体型的增加而减小,肥胖患者的转换因子可能只有普通体型患者的一半,证明DLP转换因子亦缺乏普适性｡与Gao等的研究结果类似,本研究亦表明SSDE排序重要性远远高于CTDIvol与DLP,同时也一定程度证明修正体型和组织衰减对于正确估测器官实际吸收辐射剂量的重要意义｡其次,本研究发现年龄､扫描长度与预测器官剂量值为负相关｡该研究结果表示在相同的扫描条件下对患儿进行CT检查,器官吸收剂量随着患儿年龄的增大可能会呈现降低的趋势｡廖甜等[20]发现随着年龄的增长,脑实质吸收辐射剂量不断减小,可能是由于头围不断增大导致较大的颅骨吸收更多的辐射｡与之相似,腹盆部器官剂量的降低可能是由于年龄较大的儿童拥有较厚的躯干骨造成的｡

最后,本研究结果显示男性这一特征分布在SHAP值<0的区域,表示男性器官剂量预测值较低｡聂壮等[18]的研究结果发现在CCTA中,相同水平的SSDE条件下,女性的器官剂量会显著高于男性｡该研究猜测可能由于CCTA扫描中女性受检者乳腺的辐射敏感性远远大于男性所致｡而本组的研究对象为接受腹盆部CT扫描的患儿,扫描范围内器官差异性较小,本研究中男性器官剂量略低可能是由于大龄儿童中男性患儿的体型略高于女性造成的｡本研究也存在一些局限性:(1)为单中心回顾性研究,缺乏多中心外部验证集,后续工作可搜集多个中心不同扫描设备的数据进行模型的普适性验证｡(2)由于4~9kg组纳入患儿例数极少,因此本研究将该组排除,故构建的模型可能不太适用于特小体重患儿,在后续工作中需要纳入大量该组样本以确保模型针对全体重阶段患儿的准确性和普遍适用性｡(3)本研究中器官剂量值为腹盆腔扫描范围内器官总剂量和,后续工作将细化到单个器官剂量估测｡

综上所述,本研究证明了使用SSDE等指标构建的机器学习模型预测个体化器官剂量的可行性,具有较重大的临床意义｡一方面,本研究可以为没有Radimetrics平台､无法估测器官剂量的偏远医院提供一个较为准确便捷的预测方法;另一方面,若未来扫描定位像后可将SSDE指标作为常规辐射剂量参数显示到计算机主界面中,那么本研究可以为放射科工作人员提供一个实时准确的器官剂量预测值,从而实现辐射剂量和影像图像质量平衡的最优解｡

参考文献:

15张见,张晓军.快速计算儿童CT检查体型特异性剂量值的探讨[J].放射学实践,2024,39:671⁃677.

16张见,杨凤,张晓军.儿童腹部CT诊断参考水平的初步研究[J].临床放射学杂志,2023,42:1304⁃1309.

基金资助:天津市医学重点学科(专科)建设项目基金资助项目(编号:TJYXZDXK-040A);

文章来源:张欣欣,杨楠,冯伦伦,等.基于机器学习预测儿童腹盆部CT器官剂量的可行性研究[J].临床放射学杂志,2025,44(04):712-717.