摘要:目的探究人工智能(AI)深度学习技术在低剂量胸部体检CT肺结节检出中的临床应用价值。方法回顾性分析2017年6—7月浙江中医药大学附属第一医院医学影像科低剂量胸部体检CT图像700例,统计影像医师在AI辅助前后阅片的检出率,以2名高年资影像医师的一致意见作为结节判断的“金标准”。随机抽取300例图像,2名规范化培训(规培)医师和2名高年资医师在AI辅助前后分别阅片,比较两者结节诊断的准确性增益率和时间增益率。运用SPSS25.0软件进行统计学差异的分析。结果700例CT图像中共包含1771个阳性结节,影像医师独立诊断的检出率为86.62%,AI辅助后检出率为99.27%。基于深度学习的AI软件的假阳性率为每例5.90个,删去直径小于3mm的结节后,假阳性率降为每例1.90个。高年资影像医师与规培影像医师的准确性增益率分别为2.78%和8.33%,两者差异有统计学意义(P<0.05);时间增益率分别为24.53%和39.04%,两者差异有统计学意义(P<0.01)。结论基于深度学习的AI辅助诊断系统能有效地提高影像医师的诊断效率。
肺癌是我国最常见的恶性肿瘤之一,其男女死亡率皆居于首位[1]。肺癌恶性程度高,早期症状不明显,极易耽误最佳治疗时间[1]。因此,对肺癌的早期筛查和诊断已成为肺癌患者及时接受有效治疗及提高生存率的关键[2]。目前,相比X线等传统检查方法,低剂量CT扫描可有效提高肺癌的早期检出率,且安全性较高[3]。肺结节的精确检出是实现临床上肺癌早期诊断的基础[4]。所以,日常的胸部体检对肺结节的检出尤为重要[5]。低剂量CT中肺结节的检出取决于其大小、密度、位置等因素,如低剂量CT对直径大于4mm的结节敏感度为75.00%,假阳性率为2.05FPs/Scan;对大于8mm的结节敏感度为79.30%,假阳性率为1.01FPs/Scan[6]。随着影像设备性能的提升与胸部CT图像数量的迅猛增长,放射科诊断医师数量明显不足,再加上主观视觉疲劳、诊断信心和水平高低不等诸多原因,造成同质化诊断推广不足,诊断存在一定的误诊率、漏诊率和区域差异性[7]。基于三维卷积神经网络(3D-CNN)建立的人工智能(AI)深度学习模型[8],经大量临床有效数据训练,其对肺结节的分析已有较快的运算速度;同时,随着模型的不断优化[4],其准确率也有大幅度提升,可大大减轻影像医师的阅片压力[9,10]。金晨望等[7]建议将肺结节AI辅助诊断准确性增益率(单位时间、单位人员条件下,诊断准确性增益率=AI辅助诊断准确率与人工诊断准确率差值/AI辅助诊断准确率与人工诊断准确率中的高值×100%)和平均时间增益率(单位时间、单位人员条件下,诊断平均时间增益率=AI辅助诊断平均时间和人工诊断平均时间差值/AI辅助诊断平均时间和人工诊断平均时间中的高值×100%)作为肺结节AI辅助诊断技术应用于临床的重要指标之一。故本研究旨在研究AI辅助下医师诊断低剂量胸部CT肺结节的准确性增益率和时间增益率,探究AI深度学习技术在肺结节检出中的效果。
1、资料与方法
1.1一般资料
回顾性分析浙江中医药大学附属第一医院医学影像科2017年6—7月低剂量胸部CT体检图像1137例。纳入标准:(1)低剂量胸部平扫薄层CT;(2)能在推想系统识别图像并进行诊断和分析结果。排除标准:(1)存在严重伪影,对肺结节判断造成影响的;(2)严重纤维化、肺大泡、多发钙化灶等明显干扰肺结节诊断的图像。故本研究排除437例不符合标准的图像,包括98例存在严重伪影,106例存在严重纤维化,79例存在严重肺大泡,另有122例显示有多发钙化灶;此外,还有32例CT图像无法导入推想系统,故也排除,最终入选700例有效数据。本研究经医院伦理委员会批准同意(2019-KL-025-01)。
1.2方法
1.2.1CT扫描技术
所有检查由西门子SOMA-TOM、SENSATION64层螺旋CT和东芝AquilionONETSX-301C螺旋CT进行扫描。扫描范围自肺尖至肺底,两侧至腋窝,患者一次吸气后屏气,保持屏气状态至扫描完成。扫描参数:螺旋扫描,管电压120kVp,管电流50mA,螺距0.60,层厚5mm,层间距5mm,图像矩阵512×512,视野300mm×300mm。使用标准算法重建0.75mm的薄层轴位图像。
1.2.2肺结节检测
采用基于3D-CNN建立的深度学习模型和AI软件———推想科技AI影像辅助筛查系统(InferRead?CTLung,推想),该系统由推想科技有限公司提供。将700例低剂量胸部体检CT数据导入工作站,推想自动进行肺结节大小分析、位置标识及风险评估。影像医师以直径小于30mm圆形或不规则形、边界清或不清的高密度阴影作为判断标准,进行肺结节的诊断。
1.2.3结节标准认定
由2名有10年以上胸部影像诊断经验的资深影像医师进行阅片,参考影像报告并在AI系统辅助下做出结节判断,取两人的一致意见作为评判的“金标准”,若出现分歧,增加1名资深医师对疑虑部分再次阅片,三人商讨形成最终意见。
1.2.4研究方法
本研究选取浙江中医药大学附属第一医院2017年6月1日至2017年7月15日符合纳入标准的700例低剂量胸部体检CT数据,进行影像医师与深度学习的AI软件结合前后结节检出率的对比。采用整群随机抽样法分别对700份中每例结节个数为0、1、2、3、4个及以上这5个群体的病例进行编号,借助python的random函数随机总共生成300个序号,包括150个序号A和150个序号B,见表1。
表1整群随机抽样法下150例研究数据A和150例研究数据B的构成
150例数据A,由2名资深影像医师和2名规范化培训(规培)影像医师在相同条件下(所用显示器型号为DELLE1913S,屏幕分辨率为1280×1024,阅片光线充足、无外界干扰、图像清晰,150份数据A的阅片时间为2019年8月2日至8月11日每日14:00—16:00,150份数据B的阅片时间为2019年8月12日至8月21日每日14:00—16:00)分别阅片,分别计算各自的检出率、速率,再结合AI软件辅助诊断,计算各自的检出率、速率。随机抽取的150例数据B重复试验,取平均值。计算资深影像医师和规培影像医师的准确性增益率和时间增益率。
1.3统计学处理
采用统计学软件SPSS25.0进行数据处理与统计分析,分别计算资深影像医师、规培影像医师、AI和AI辅助阅片的肺结节检出率、假阳性率、时间增益率和准确性增益率。采用两配对样本非参数检验方法来对结果进行统计分析,若P<0.05,则认为差异有统计学意义。
2、结果
2.1数据统计
入选的700例CT图像经2位影像专家确认共包含1771个真结节,数据呈非正态分布,检出结节直径最大为16.60mm,平均(3.60±1.90)mm。其中最大直径为0~3mm的有166个,>3~7mm有1406个,>7~11mm有181个,>11~16mm有17个,>16~20mm有1个。患者年龄23~104岁,平均(58.99±15.70)岁;男303名,女397名。
2.2影像医师独立判断下与AI辅助后结节检出率比较
对于700例胸部体检CT图像,AI的检出率为100.00%,影像医师独立判断下共检出1534个结节,检出率为86.62%,AI辅助诊断后共检出1758个结节,检出率为99.27%。各分段结节检出率对比见表2。
2.3影像医师独立判断下及AI辅助下肺结节漏诊分布情况比较
相较于AI,影像医师的漏诊主要体现在0~7mm的结节上,漏诊率为15.08%(237/1572)。其中0~3mm的结节漏诊率最高,>3~7mm的结节漏诊个数最多。去除直径小于3mm的结节后,人工漏诊率降为11.65%。各分段结节漏诊率见表3。
表2影像医师独立判断下与AI辅助后结节检出率比较
表3影像医师独立判断下及AI辅助下肺结节漏诊分布情况比较
2.4基于深度学习的AI软件和影像医师及两者结合的结节检出假阳性情况比较
深度学习的AI软件检出的假阳性结节数为4121个,假阳性率为平均每例5.90个。排除最大直径小于3mm的结节后,假阳性率降低为每例1.90个。影像医师独立判断下检出的结节中假阳性结节总计为58个,假阳性率为每例0.10个,基本集中于结节直径在3~7mm。影像医师在AI辅助诊断下检出的假阳性结节数大大减少,假阳性率为0。
2.5规培影像医师和资深影像医师在AI深度学习技术辅助诊断下的准确性增益率、时间增益率比较
资深影像医师在AI辅助诊断下的准确性增益率为2.78%,时间增益率为24.53%;规培医师在AI辅助诊断下的准确性增益率为8.33%,时间增益率为39.04%。不同资历医师对各分段结节检出的准确性增益率见表4。
表4不同资历医师在AI辅助下对不同分段肺结节检出的准确性增益率比较
3、讨论
本研究结果表明,基于深度学习的AI辅助诊断系统对胸部体检CT图像中的结节有较高的敏感度,尤其是对直径小于7mm结节的检出能力明显高于影像医师,但同时,AI系统的假阳性率也较高,达到每例5.90个。但当去除最大直径在3mm以下的结节后,假阳性率降低为每例1.90个。影像医师在AI辅助下的诊断效率和准确率得到明显的提高,漏诊结节的减少、整体判断时间的缩短和假阳性结节的再次考虑,直接提高了大批量体检报告的诊断质效。在随机抽取的300例数据中,资深医师的时间增益和准确性增益都不显著,分析其原因,推想AI辅助资深医师虽能100%检出结节,但仍有较多假阳性结节,医师们需逐个判断,这并没有从根本上减少阅片耗时。因此,导致时间增益率仅为24.53%,不甚显著;且资深医师在阅片时未将一些意义不大的小结节写入报告中,如AI+医师的总结节检出率只有99.27%,尤其直径小于或等于7mm的结节检出率仅92.30%,此情况下并非漏诊,却导致准确性增益率也不甚显著。而规培医师的结节检出准确性得到明显提升,尤其对于直径0~3mm的小结节增益明显,且时间增益率远高于AI辅助下的资深医师,这说明,AI深度学习技术对规培医师等低年资医师的专业知识掌握、诊断技术提升和独立判断能力提高等方面有显著效果。一方面,这一特殊人群存在工作量大、连续工作时间长、缺乏休息时间等问题,影像医师的工作环境相对比较封闭,每日所需书写报告量达60份以上,每份报告约需8min,疑难病例则需更长时间,高强度、长时间状态下的阅片准确率更易受视觉疲劳的影响;另一方面,其对小结节的判断尚存在一定的挑战,真假结节的判断易受大小、位置、密度和周围组织的干扰,低年资医师的独立诊断能力尚存在很大的提升空间[11]。
得益于高质量数据的增加、高性能计算能力的提高、深度学习框架的普及、算法示例程序的进步及相关领域人才的丰富,深度学习技术在近年来取得了高速发展,在宫颈癌前病变[12]、乳腺钙化检出[13]、糖尿病视网膜病变[14]、自发性脑出血病灶检出[15]、骨龄预测[16]等方面都得到较好的应用。当然,将AI深度学习技术放心地应用到临床目前还存在一些挑战,如图像分析中的假阳性过高的问题。这可能有以下几方面原因:(1)肺结节在形状、大小、类型上存在的差异;(2)肺间质对结节检出的干扰;(3)目前用于训练模型的肺结节数量还不够多,例如最大的公开可用的肺结节数据集LIDC-IDRI数据库[17]与ImageNet数据集的大小相比仍要小得多;(4)深度算法的最佳输入大小及深度尚未可知[18]。所以,AI深度学习技术需要临床医师的反复使用和反馈,以及软件开发者对模型的不断优化,来加速其成熟完善,以至于发挥其最大效益[19,20]。
本研究的局限性表现在如下几个方面:(1)病例量相对较少且为单中心研究,本研究结果还有待外部数据的验证;但是由于推想系统深度学习模型的训练已基于多中心病例,因此该研究结果依旧可信赖。(2)本研究中被测试者在测试状态下观察CT图像,因无法真实全面地还原医师日常的工作环境,导致研究数据与临床实践略有出入;但是由于本研究样本量较多,已将误差控制在合理范围内,因此该研究结果仍有一定说服力。(3)在临床实践中,影像医师在书写诊断报告时会舍去部分无意义结节,避免患者及家属过度焦虑,因此间接造成了本次研究中影像医师独立诊断时肺结节检出率的低下;但是由于影像医师舍去的部分无意义结节直径主要集中在0~3mm,因此对研究结果影响较小。
综上所述,基于深度学习的AI辅助诊断系统能显著提高低年资影像医师对肺结节的诊断效率。
参考文献:
[1]黎开瑞.肺癌的早期筛查现状分析[J/CD].临床医药文献电子杂志,2019,6(40):192-193.
[2]孔维嘉,安甜,吕博.低剂量螺旋CT肺癌筛查及肺结节的研究现状[J].实用肿瘤学杂志,2018,32(1):68-72.
[3]夏禹,黄国飚.低剂量CT扫描与普通剂量扫描对早期肺癌诊断的临床诊断价值[J].影像研究与医学应用,2018,2(22):84-85.
[5]李小雪,蒲红,尹芳艳,等.肺部结节的诊疗新进展[J].放射学实践,2019,34(5):578-582.
[6]明佳蕾,方向明.基于人工智能的CT肺结节检出临床应用及研究进展[J].中华放射学杂志,2019,53(6):522-525.
[7]金晨望,郭佑民.人工智能辅助诊断技术在低剂量CT肺结节筛查中的应用及质控[J].中华放射学杂志,2019,53(1):6-8.
[11]王爽,雷盛,谷涛,等.人工智能肺结节辅助诊断软件在肺CT检查结节分析中的临床应用[J/CD].中华肺部疾病杂志(电子版),2019,12(6):757-759.
[12]陆晗.基于深度学习和宫颈图像的癌前病变识别[D].南昌:南昌航空大学,2019.
[13]周娟,王婷婷,李明,等.基于深度学习的乳腺X线摄影钙化检出系统评估[J].中华放射学杂志,2019,53(11):968-973.
[15]王霁雯,林雨,熊建华,等.基于深度学习的自发性脑出血CT影像分割算法精准计算病灶体积的应用探讨[J].中华放射学杂志,2019,53(11):941-945.
[16]宋娟,宫平,高畅,等.基于深度学习的儿童骨龄智能评估模型构建及初步临床验证[J].中华放射学杂志,2019,53(11):974-978.
[17]李欣菱,王颖.人工智能在肺结节检测与诊断中的应用及发展[J/CD].新发传染病电子杂志,2019,4(3):185-189.
[19]王成弟,郭际香,杨阳,等.利用深度学习技术辅助肺结节的人工智能检测[J].中国呼吸与危重监护杂志,2019,18(3):288-294.
文章来源:郭依楠,崔鑫烨,戴瑜洁,项萍,高晨,周长玉.人工智能深度学习技术在低剂量胸部CT肺结节检出中的应用价值[J].现代医药卫生,2021(10):1632-1635+1640.
基金:浙江省医药卫生科技计划项目(2019KY117)
分享:
人工全膝关节置换术(total knee arthroplasty, TKA)被认为是治疗严重膝关节损伤及晚期膝关节骨性关节炎的有效手段,而影响膝关节置换术的远期疗效的因素很多,其中下肢力线对齐和软组织平衡作用的重要作用被学术界广泛认可,良好的力线对位可以有效提高膝关节假体的使用寿命、改善关节活动及减少术后疼痛[1,2,3]。既往研究指出,在下肢力线的对位中,胫骨假体垂直于胫骨解剖长轴可获得良好的力线。
2024-04-25脊柱恶性肿瘤是指发生于脊柱的原发性或继发性肿瘤疾病,其中原发瘤占恶性肿瘤的4.2%[1],以多发性骨髓瘤(multiple myeloma, MM)较为常见,多是骨髓浆细胞异常增殖累及脊柱所致[2]。而继发瘤则以脊柱转移瘤(metastatic spine tumors, MST)较为多发,主要是由于肺癌、乳腺癌、宫颈癌、肝癌等原发病灶血行转移至脊柱而致[3]。
2024-04-12肺癌是临床常见的恶性肿瘤疾病,其发病率居恶性肿瘤发病率之首,非小细胞肺癌是肺癌的主要种类;而鳞癌和腺癌是临床最常见的非小细胞肺癌病理类型,但两者在临床治疗方面具有较大差异[1,2]。手术病理检查是诊断肺癌病理类型的金标准,但其是一种有创检查,局限性较大,不适用于临床常规检查,而近年来影像学检查方法在各种恶性肿瘤疾病的鉴别诊断中发挥着重要作用。
2024-04-12近年来,由于各种免疫抑制剂和激素的大量应用、器官移植的开展以及人类免疫缺陷病毒(HIV)感染人群的增多和新型冠状病毒的蔓延,肺部真菌感染的发生率明显上升。侵袭性念珠菌病(invasive candidiasis, IC)是最常见的侵袭性真菌感染,而白色念珠菌是IC患者中最常见的病因。
2024-04-09胃肠道间质瘤(gastrointestinal stromal tumor, GIST)是消化道最常见的间叶源性肿瘤,约占消化道所有恶性肿瘤的1%~3%[1]。GIST在个体患者中表现出不同程度的恶性潜能,美国国立卫生研究院(national institutes of health, NIH)2008改良版危险度评估标准依据病理标本中肿瘤大小、肿瘤原发部位、核分裂象计数(mitotic index, MI)、肿瘤是否破裂等指标将GIST划分为极低、低、中、高危4个等级。
2024-04-08近年来,随着全球老龄化进程加速,慢性肾脏病的临床发病率逐年增加,已成为威胁人类生命健康的主要疾病之一。在临床治疗方面,维持性血液透析(maintenance hemodialysis, MHD)仍是治疗慢性肾脏病的主要方式,可有效清除毒素、纠正机体电解质紊乱,改善患者症状。需要指出的是,建立有效的血管通路是MHD治疗的基础。
2024-04-01胆道梗阻是常见的临床疾病,患者胆道病变的良恶性鉴别诊断对治疗方案的确定及预测预后有重要意义[1]。传统诊断方法主要是胆道造影,对胆管树形态显示较好,但这种有创性操作只能显示梗阻一端的胆管形态,不能显示周围软组织,且对于操作人员的技术要求比较高[2,3]。超声诊断的组织分辨率较低,对胆总管及梗阻区域的病变显示较差。
2024-03-28随着CT扫描的不断普及,人们发现早期肺腺癌常常以磨玻璃结节(ground glass nodule, GGN)的形态出现。在2021年第5版WHO分类中,非典型腺瘤样增生和原位腺癌被归为前驱腺体病变[2] (precursor glandular lessions, PGL),其中原位腺癌的生物学行为表现为无周围间质、血管和胸膜的侵犯[3]。原位腺癌是否有必要在第一时间切除,这也引起医疗界的广泛关注。
2024-03-11冠心病(coronarg artery disease, CAD)是全球居民死亡的最主要原因,也是降低生活质量的主要因素[1]。因此早期发现冠状动脉病变至关重要,可显著降低其发病率和死亡率[2]。冠状动脉血管造影(ICA)是目前诊断冠状动脉狭窄程度的金标准,但该检查有创且费用较高[3]。冠状动脉CT血管成像(CCTA)是一种有效的非侵入性的血管检查方法,其对冠状动脉阻塞情况能达到与ICA相似的诊断及预后评估[4]。
2024-03-08结合CT影像可以排除一部分良性肺结节,但仍有部分结节经手术切除病理确诊为良性[4]。因此,需要寻找新的方法或生物标志物来预测肺结节的恶性倾向。表观遗传学在许多疾病的发生和发展中起着至关重要的作用,DNA甲基化是研究最充分的表观遗传修饰之一[5]。异常的DNA甲基化促进肿瘤发生,在肺腺癌的发展过程中,DNA甲基化改变甚至在非典型腺瘤样增生形成之前就已经发生[6]。
2024-03-06人气:6309
人气:6222
人气:5857
人气:5413
人气:4865
我要评论
期刊名称:CT理论与应用研究
期刊人气:1394
主管单位:中国地震局
主办单位:中国地震局地球物理研究所,同方威视技术股份有限公司
出版地方:北京
专业分类:医学
国际刊号:1004-4140
国内刊号:11-3017/P
创刊时间:1987年
发行周期:双月刊
期刊开本:16开
见刊时间:10-12个月
影响因子:0.923
影响因子:1.022
影响因子:1.831
影响因子:0.793
影响因子:0.000
400-069-1609
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!