摘要:目的 构建并验证基于增强CT影像组学的机器学习模型预测肾癌免疫组化指标P504S/α-甲基酰基辅酶A消旋酶(P504S/AMACR)表达状态。方法 回顾性收集并分析蚌埠医科大学第一附属医院2019年1月~2024年9月经病理证实为肾癌且明确了P504S表达状态的117例患者的临床、病理及影像资料。基于对比增强CT提取病灶三维影像组学特征,建立预测模型对P504S阴性和P504S阳性进行鉴别。将患者按7∶3的比例随机分为训练集和测试集,对训练集进行5倍交叉验证选择最优超参数建立预测模型,使用测试集进行验证,采用ROC曲线、校准曲线及决策曲线分析评估模型诊断效能。采用合成少数派过采样技术进行均衡化,基于CT的动脉期和静脉期勾画感兴趣体积,通过Min-max进行数据归一化,主成分分析和皮尔森相似度降维,采用Relief算法进行特征筛选,支持向量机和Native Bayes作为分类器分别构建动脉期和静脉期影像组学模型。结果 动脉期影像组学模型在训练集和测试集上的曲线下面积(AUC)和准确度可分别达到0.801和0.805、0.833和0.743。静脉期影像组学模型在训练集和测试集的AUC和准确度可分别达到0.791和0.683、0.808和0.714。动静脉期联合模型对所有病例诊断的AUC可达0.846(95%CI:0.768~0.906),高于动脉期影像组学模型[0.804(95%CI:0.720~0.871)]和静脉期影像组学模型[0.823(95%CI:0.742~0.887)],但差异无统计学意义(P>0.05)。结论 基于肾癌增强CT影像组学特征的机器学习模型可以预测免疫组化指标P504S表达状态。
加入收藏
P504S/AMACR是一种参与支链脂肪酸β-氧化的代谢酶,在肾肿瘤中具有重要临床价值。作为乳头状肾细胞癌的敏感标志物,其在透明细胞肾细胞癌中与淋巴结转移及Furhman分级显著相关,并在多种肾肿瘤类型中呈阳性表达[1-4]。该酶通过催化支链脂肪酸代谢中间体的差向异构化促进β-氧化进程,当其高表达时可增强代谢活性,加速肿瘤细胞增殖[5-7]。随着全球恶性肾肿瘤发病率上升(占癌症2%)及术后5年生存率低下,P504S/AMACR的促癌机制研究为靶向治疗提供了潜在方向[8]。目前已研究出有多种AMACR抑制剂,不仅对AMACR有较高敏感度,还能杀死癌细胞[9]。在实际临床应用中,通常将P504S阴性和P504S阳性肾肿瘤患者统一考虑并治疗,但随着临床研究的深入,这2种人群肿瘤的侵袭性和预后都有显著差异[3]。P504S阴性患者可采用肾癌常用的靶向药物进行治疗,从而控制病情的发展,但阳性患者存在AMACER靶点,因此其可从靶向药物中获益更多[9]。
经皮肾活检是诊断肾癌内部病理特征和免疫组化指标的金标准,但其属于侵入性检查,可能对一些年老体弱的患者产生不耐受甚至出现各种并发症,因此非侵入性成像方法有很大价值[10]。影像组学是一个新兴领域,是一种从标准影像图像中提取出定量特征并将其转化为可重复测量的定量数据,这些定量数据与临床信息相结合,可提高疾病诊断效应性、指导治疗策略以及评估预后[11]。目前,已有关于利用基于CT影像组学模型区分肾癌病理分型的临床研究[12],但对于进一步预测肾癌内部免疫组化指标P504S表达情况的研究较少;既往研究表明,P504S在正常肾组织(尤其近曲小管)中也有弱阳性表达,这导致诊断特异性受限,尤其在与正常组织或良性病变(如肾腺瘤)的鉴别中[4]。创新性地整合增强CT多期相(如皮髓质期、肾实质期)的影像特征,可显著提升模型对P504S表达的敏感度和特异度。此外,基于增强CT影像组学的高通量特征提取技术,实现了通过CT图像数据间接反映肾肿瘤分子表达水平的可能性。P504S高表达区域常伴随不均匀强化,这类特征可通过影像组学特征实现三维空间定位,为靶向治疗提供指导。基于此,本研究探讨肾癌CT影像组学特征预测P504S表达情况,使用手动勾画感兴趣体积(VOI),建立准确预测P504S表达情况的影像组学模型,并通过未参与建模的独立测试组数据对预测P504S表达进行评估,提高预测准确性和模型的稳定性,帮助临床医生做出更准确的诊断,制订更合理的个体化治疗方案。
1、资料与方法
1.1研究对象
回顾性分析2019年1月~2024年9月于蚌埠医科大学第一附属医院肾癌患者的腹部CT影像资料。纳入标准:患者术前1月内行常规全腹部横断面CT平扫和增强扫描;活检或手术病理证实为肾癌,并明确P504S表达状态;图像质量满足诊断要求,且不考虑肿瘤大小问题。排除标准:存在其它恶性肿瘤;术前经过内分泌治疗或抗肿瘤治疗;病灶附近含有肾癌以外难以鉴别区分的病变。所有肾肿瘤的病理诊断均由蚌埠医科大学第一附属医院病理科对病灶活检、部分切除或根治性切除后进行分析而建立的。本研究对患者信息进行匿名处理,所有患者监护人放弃了知情同意;本研究获得蚌埠医科大学第一附属医院医学伦理委员会批准(审批号:[2023]426号),并遵循赫尔辛基原则的声明。
1.2CT图像的获取
影像数据来自GE64排螺旋CT和GERevolution256排螺旋CT扫描仪,扫描参数为管电压120kV,管电流250mA,螺距1.5mm。患者均为仰卧位,屏气时扫描,范围为全腹部,经肘静脉以3.5mL/s注入碘对比剂60~80mL,于对比剂注射后25~30s、55~60s扫描获取动脉期及静脉期增强图像,后将其上传到图片存档和通信系统。所有研究包含3期扫描,包括平扫、动脉期和静脉期。
1.3影像组学特征提取
在医院图片存档和通信系统中把筛选后所有患者的图像以医学数字成像通信格式导出,并选取每位患者的动脉期、静脉期轴向图象,导入3D切片器(开源软件版本5.4.0)进行肾肿瘤分割。使用半自动工具手动分割肿瘤的示例(图1),在肿瘤动脉期和静脉期的轴向各个层面沿病灶边缘采用半自动方式勾画VOI,并测量传统影像学特征,测量时避开病灶周围水肿区、坏死以及囊性成分、钙化。CT横断位图像中肿瘤的轮廓由具有10年临床经验的放射科医生进行复检及纠正。
图1使用3DSlicer中的半自动工具手动分割肿瘤的示例
通过Pyradiomics提取影像组学特征,包括基于形状的特征、一阶统计特征、灰度共生矩阵、灰度依赖矩阵、灰度行程长度矩阵、灰度大小区域矩阵、相邻灰度差矩阵、小波变换及拉普拉斯变换。
1.4模型构建
以7∶3比例随机将患者分为训练集和测试集,以临床资料中的性别和年龄为参考,确保分组完成后两组临床特征无差异。为了消除训练数据集的不平衡性,在研究时通过合成少数派过采样技术进行平衡处理。在特征矩阵上进行了Min-max归一化处理,动脉期模型应用主成分分析进行降维预处理。使用Relief算法来选择特征,它可选择子数据集,并根据标签递归找到相关特征。使用支持向量机(SVM)作为分类器,在训练队列中进行5倍交叉验证以确定最优超参数,并对独立测试集进行内部验证。静脉期模型通过Pearson相似度(>0.9)降维,使用Relief来进行特征筛选,采用NativeBayes作为分类器。在动脉期(模型1)和静脉期(模型2)的最优模型基础上,进行多变量二元逻辑回归分析,构建联合诊断模型及列线图(模型3)。
1.5统计学分析
采用SPSS27对数据进行统计学分析。计数资料以n(%)表示,组间比较采用卡方检验;对于正态分布的计量资料以均数±标准差表示,组间比较采用独立样本t检验,非正态分布的资料以中位数(四分位数间距)表示,组间比较采用Mann-WhitneyU检验。采用ROC曲线分析对模型的性能进行评价,并计算曲线下面积(AUC)以进行量化诊断效能;计算模型的准确度、标准误、敏感度、特异度、阳性预测值和阴性预测值。采用De-Long检验对任意两模型的AUC进行比较。以P<0.05为差异有统计学意义。
2、结果
2.1临床资料
117例患者中,P504S阴性30例,阳性87例,研究流程(图2)。P504S(-)和P504S(+)中均为女性所占比例较高,但组间差异无统计学意义(P=0.44);两组年龄的差异也没有统计学意义(P=0.43)。患者大多为肾部分切除或者根治性肾切除,年龄集中在50~70岁。P504S阴性和阳性患者的人口学资料和临床特征(表1)。
图2患者的纳入和排除流程图
表1纳入患者和肾肿瘤基本特征
2.2动脉期模型诊断效能(模型1)
基于8个最有价值的特征的模型可以在验证数据集上获得最高的AUC,AUC和准确度可分别达到0.801、0.805。此时,模型在测试数据集上的AUC和准确度分别达到0.833和0.743(表2)。所有数据(117个病灶)的AUC达0.804,SE达0.047,95%CI为0.720~0.871(表3)。动脉期模型在训练集和测试集的ROC曲线(图3)
表2动脉期和静脉期影像组学预测模型分别在训练集和测试集的诊断效能
表33种影像组学预测模型的诊断效能
2.3静脉期模型诊断效能(模型2)
基于7个最有价值的影像组学特征的模型在验证数据集上AUC达0.791,准确度达0.683。模型在测试数据集上的AUC和准确度分别达0.808和0.714(表2)。全体数据(117个病灶)的AUC达0.823,SE达0.042,95%CI为0.742~0.887(表3)。静脉期模型在训练集和测试集的ROC曲线(图4)。
图3动脉期影像组学模型在训练集和测试集上的ROC曲线
图4静脉期影像组学模型在训练集和测试集上的ROC曲线
2.4动静脉期联合模型诊断效能及模型间比较
动、静脉期模型构建联合诊断模型列线图(图5)。在117例病灶的基础上,AUC达0.846(95%CI:0.768~0.906,表3)。模型1和模型2的AUC分别为0.804、0.823。De-Long检验结果显示,模型1和模型2、模型1和模型3、模型2和模型3之间AUC的差异无统计学意义(P>0.05,表4)。决策曲线分析显示3个模型均具有临床净收益(图6)。3种预测模型的ROC曲线(图7)。
图5两种影像组学预测模型的列线图
表4模型1和2、模型1和3、模型2和3的诊断效能鉴别
图63种影像组学预测模型的决策曲线分析
图7用于鉴别P504S(-)和P504S(+)的3种影像组学预测模型的ROC曲线
3、讨论
本研究对多期CT增强序列提取三维影像组学特征,在进行降维、筛选,使用SVM和NativeBayes作为分类器建立模型,结果显示基于增强CT横断位图像可用于鉴别肾肿瘤中P504S表达状态。影像组学模型在3个模型中的的诊断性能参数分别为动脉期模型的AUC高达0.804(95%CI:0.720~0.871);静脉期模型的AUC高达0.823(95%CI:0.742~0.887);而联合模型的AUC可达0.846(95%CI:0.768~0.906),动静脉联合模型对P504S阳性和阴性的鉴别性能略有提高。在这个临床数据集中,所有的肾肿瘤标本都进行了病理组织学评估。本研究通过单一增强期相图像和联合模型来鉴别P504S阳性和阴性都取得了良好的诊断效果。
P504S(AMACR)是一种从前列腺癌中鉴定的癌相关蛋白,其表达水平与多种恶性肿瘤进展正相关[13]。研究表明,AMACR在前列腺癌、黏液纤维肉瘤、乳腺癌(26%过表达且高级别更强)及肾肿瘤(随病理分级升高表达增强)中均呈现促癌特性,能加速细胞增殖并增强侵袭性[4,5,14]。目前针对AMACR的RNA干扰疗法已证实可抑制癌细胞生长,相关抑制剂研究及临床数据显示其具有双重潜力:既是分子靶向治疗的理想靶点,也可作为肾肿瘤等癌症的预后评估生物标志物,在精准医疗中展现出重要应用前景[3,15,16]。在本研究中,P504S阴性30例,阳性87例,其中病理分型为透明细胞肾细胞癌者均占这两类人群最高比例,这与透明细胞肾细胞癌亚型最为常见密切相关,在P504S阳性病例中有16例乳头状肾细胞癌,这也符合P504S最初被认定为乳头状肾细胞癌敏感标志物[2]。将所有数据按7∶3分为了验证集以及测试集,构建了动脉期、静脉期以及动静脉期联合模型。动脉期模型在验证集上AUC和准确度分别为0.801和0.805,而测试数据集上的AUC和准确度可达0.833和0.743;静脉期模型在验证集的AUC可达0.791以及准确度为0.683,此时,模型在测试数据集上的AUC和准确度分别达到0.808和0.714。这均表明预测模型是有一定诊断效能的。结合本研究可初步得出,P504S不仅存在于各种肿瘤细胞中尤其是肾肿瘤,而且可通过CT影像学特征预测其具体表达状态。
目前,对比增强计算机断层扫描(CECT)已成为评估肾脏病变最普遍采用的成像技术。CECT可识别肾脏的实性肿块,而增强程度也是鉴别肾肿瘤亚型最有价值的参数[17],本研究117例病灶均通过CECT扫描所识别,其中透明细胞肾细胞癌高达82例,因为此亚型比其他亚型的肾恶性病变增强程度更大[18],但增强不明显或者罕见的病灶则无法直接通过影像学得出具体分型,如本数据集中的XP11.2易位/TFE3基因融合相关性肾癌;此外肾癌传统CT特征也已被评估,用来试图预测分期、核分级[18]。然而,仅凭CECT很难准确判断病变的其他特性,如免疫学指标,尽管CECT上的一些特征可能暗示肿瘤的组织学类型,但这些迹象往往缺乏足够的特异性,不足以支持临床做出明智的决策[19]。存在手术治疗禁忌患者需要通过非手术手段进行治疗,如靶向治疗,在这种情况下,则需要预处理核心活检来评估肿瘤的病理组织学特征[20]。尽管现代病理活检在判断肿块的组织学指标上有较高的准确性,但它仍存在一定的局限性,因此,需要一种非侵入性方法进行预测肿瘤的免疫组织化学指标[20]。在肿瘤影像学中,影像组学方法旨在将病变的影像学表型与其他重要的临床信息(如分子状态、免疫组织化学、基因组和蛋白质组学特征等)联系起来[21,22],提取有关疾病的分子状态、侵袭性和预后的信息,这将有助于个性化治疗计划并预测肿瘤对靶向治疗的反应[23]。放射科医生的评估本质上是基于定性的标准,受到高可变性和失败的影响,为了克服传统方法的局限性,许多研究者已经对机器学习进行了测试,以开发基于影像组学特征分析的诊断模型[23]。相关研究者已经利用MRI联合影像组学的机器学习对前列腺肿瘤中的P504S进行检测,在该研究中所构建的5个模型内,Relief算法在一般评价中表现最好(微平均AUC=0.920,宏观平均AUC=0.870),再进一步的子标签预测中结果最准确(标签0、1、2的准确率可分别达到0.831、0.831、0.932)[24]。相关研究利用多模态MRI研究P504S表达时,前列腺癌组的Tmax(s)=21.30±10.78、SImax%=1.75±0.39、Rmax%=20.20±15.50;非前列腺癌组的Tmax(s)=50.22±36.31、SImax%=1.24±0.41、Rmax%=7.98±6.25(P<0.01),这表明影像组学在生物标志物检测方面确实有所获益[25],同时也反映出P504S的表达可以通过影像学特征进行预测,这为本研究提供了理论依据。
本研究利用影像组学特征和机器学习方法运用术前CT成像来预测P504S表达情况。在验证数据集上模型1的AUC为0.801,ACC达0.805(95%CI:0.672~0.913);模型2的AUC为0.791,准确度达0.683(95%CI:0.670~0.893),而在测试数据集上获得了模型1的AUC为0.833,准确度为0.743(95%CI:0.675~0.949);模型2的AUC为0.808,准确度为0.714(95%CI:0.6389~0.9359),这些结果表明了机器学习方法的高诊断性能。本研究使用了SVM和NativeBayes两个分类器进行模型的构建,SVM能在保证分类精度的同时实现对线性可分样本的最优分类,而NativeBayes则是通过某对象的先验概率,利用Bayes公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类,最后在全体数据(117例病灶)的基础上,模型1、2、3的AUC值分别为0.804、0.823、0.846,表明本研究构建的模型在预测肾肿瘤中免疫组化指标P504S方面有较好的诊断能力,以此可以减少所需活检的次数。同时,相比于动脉期,静脉期影像组学特征更能反映不同肾肿瘤P504S表达情况的影像学特征,这也向动脉期能为预测P504S表达情况增加益处提出了挑战。在动脉期(模型1)、静脉期(模型2)分别选取了8个、7个最有价值的影像特征进行预测,并最终以直方图的形式展现这些特征,直方图分析(即一阶影像组学)是一种捕获个体体素强度分布的方法,可以量化常规CT的VOI中肿瘤的异质性,一些肿瘤研究表明,这些分析确实有助于诊断评估肿块的分子学特征以及预后[26-29]。根据相关研究,乳头状肾细胞癌的P504S阳性率较高,尤其是Ⅰ型乳头状肾细胞癌。然而,P504S的表达状态需依赖术后病理检查,目前尚无广泛应用的术前无创预测肾肿瘤P504S状态手段[30]。同时,通过影像组学模型预测其他肿瘤内部P504S主要基于MRI,例如,在前列腺癌中,基于MRI的影像组学模型已成功用于预测P504S表达状态[24]。故在本研究中,通过分析P504S高表达肾肿瘤的影像特征,构建特异性增强CT影像组学预测模型,实现了术前无创预测肾肿瘤P504S表达状态,同时动静脉联合模型的诊断效能最佳,这为肾肿瘤的非手术治疗提供了另一方案。
在无法获取组织样本的情况下,影像组学模型可作为术前鉴别P504S阳性肾癌的重要工具,显著优于传统CT的形态学评估。此外,对P504S状态的预测有助于区分高级别与低级别肿瘤,指导手术范围选择(如保留肾单位手术或根治性切除)。影像组学特征(如肿瘤边缘模糊度、强化峰值时间)与P504S表达水平联合构建的预后模型,可预测患者的总生存期和无进展生存期,例如,一项纳入6119例肾癌患者的系统综述显示,结合临床分期和影像组学特征的模型对生存结局预测的AUC达0.85~0.99[31]。对靶向治疗(如抗血管生成药物)的响应可通过治疗前后影像组学特征动态变化进行评估,减少无效治疗风险。
综上所述,定量CT影像组学特征可以用来预测动脉期、静脉期以及动静脉联合模型中肾癌内部P504S表达情况。动脉期和静脉期模型的结合构成了一种最优的术前预测方法,然而该技术在临床实践之前需要进行大规模数据的验证。本研究仍存在一定的局限性:本研究是单中心且是回顾性研究,样本具有区域特征,没有外院队列进行验证,在后续的研究中应该纳入更多中心的样本;病例数量较少,缺乏排泄期扫描数据;本研究对象中未对肾癌组织学类型进行分类,后续研究将结合不同肾肿瘤亚型,并结合临床数据进行全面评估
基金资助:蚌埠医学院重点自然科学项目(2022byzd076);
文章来源:周静,杨雨琼,马宜传,等.基于增强CT影像组学特征可有效预测肾癌P504S表达状态[J].分子影像学杂志,2025,48(07):840-847.
分享:
约有30%的肾癌患者为转移性肿瘤,该类患者放、化疗治疗效果不佳,预后较差,5年生存率低于10%[2⁃3]。近年来,针对转移性肾癌的细胞因子、靶向及免疫等多种疗法取得极大进展,多样化的治疗方法使得转移性肾癌患者的无进展生存期和总生存期得以延长,其中外科手术和靶向药物的联合疗法被认为是目前最有效的治疗手段[4⁃5]。
2025-08-25临床治疗不仅旨在清除肿瘤,还需兼顾肾脏功能的保留,治疗策略的选择对患者长期生活质量及预后具有深远影响。手术是当前治疗肾细胞癌最有效的方法。根治性肾切除术是传统手术治疗方法。该手术可通过完全切除受累肾脏,达到根治的目的[2]。
2025-08-14在实际临床应用中,通常将P504S阴性和P504S阳性肾肿瘤患者统一考虑并治疗,但随着临床研究的深入,这2种人群肿瘤的侵袭性和预后都有显著差异[3]。P504S阴性患者可采用肾癌常用的靶向药物进行治疗,从而控制病情的发展,但阳性患者存在AMACER靶点,因此其可从靶向药物中获益更多[9]。
2025-07-24肾癌是泌尿系统的三大恶性肿瘤之一。老年人群为该病的高发群体,该类患者大多存在肾癌以外的麻醉以及手术高危因素,可导致围手术期并发症发生率和死亡风险显著升高,因此老年肾癌患者围术期麻醉方案的优化具有重要临床意义。目前后腹腔镜下肾癌根治术已经成为临床治疗肾癌的首选手术方式,相比于开放手术,其更能提高患者的生存率和生活质量。
2025-06-24微小RNA(miRNA)在真核细胞中广泛存在,其具有表达时序性、组织特异性和高度保守性的特点[4]。miRNA经过转录后可影响下游基因表达,对细胞分化、增殖和发育等生物学过程有调控作用,在肿瘤、心血管疾病和免疫疾病等多种疾病中发挥着重要作用[5,6]。
2025-05-28肾癌是起源于肾脏组织的疾病,手术治疗是首选治疗方式。作为局限性肾癌治疗的标准术式,根治术治疗对局限性或无明确转移者具有良好效果,但其容易对肾脏组织造成一定程度的损伤,引发急性肾损伤(acutekidneyinjury,AKI)。既往研究显示,AKI可导致患者死亡率增加,因此早识别早干预对降低患者术后透析率、改善预后具有重要意义。
2025-04-25肾母细胞瘤是儿童年龄段最常见的肾癌,其标准化治疗包括手术和化疗相结合,高危患者加放疗,预后通常良好,然而,晚期肿瘤患儿的结局仍然很差。 因此对肾母细胞瘤发病机制进行全面研究,对开发新的治疗药物具有重要意义。 青蒿琥酯( artesunate,Art) 是从中药青蒿中提取的一种水溶性衍生物,具有抗肿瘤活性。
2025-03-27肾细胞癌(RCC)是人体泌尿系统发病率最高的恶性肿瘤[1]。部分患者在疾病早期无明显临床症状,血尿、肿块、疼痛三联征为其主要晚期表现[2]。据统计,病灶直径在4cm以下的早期RCC患者,经合理治疗后5年生存率可达95%,而RCC晚期患者治疗后的5年生存率仅约20%[3]。
2025-03-24肾上腺占位性病变在当前临床工作中被认为是一类较为常见的疾病类型,在通常情况下按照其性质可分为肾上腺占位性病变及无功能性肾上腺占位性病变,对患者的生命健康通常可造成较大的影响[1]。高血压作为一类发病率较高的心血管疾病类型,在近年来的研究发现其发病率呈现出不断升高的趋势。
2025-02-24肾癌发病与希佩尔-林道(vonHippel-Lindau,VHL)基因密切相关[3-4]。MRI为诊断肾癌的常用影像学方法[5],T2WI通过组织中水分子T2弛豫时间反映其内水分子运动状态,进而提供病灶内部结构信息,对判断肾癌分型具有重要价值[6]。本研究观察MRT2WI瘤内及瘤周影像组学预测肾癌VHL基因突变的价值。
2025-02-24人气:24255
人气:19289
人气:18217
人气:17588
人气:17198
我要评论
期刊名称:分子影像学杂志
期刊人气:3180
主管单位:广东省教育厅
主办单位:南方医科大学
出版地方:广东
专业分类:医学
国际刊号:1674-4500
国内刊号:44-1630/R
邮发代号:46-548
创刊时间:1977年
发行周期:季刊
期刊开本:大16开
见刊时间:7-9个月
影响因子:0.913
影响因子:0.000
影响因子:0.384
影响因子:0.173
影响因子:2.400
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!