
摘要:目的 基于数据挖掘技术,探讨在缺氧条件下铁死亡参与结肠癌的机制。方法 以TCGA-COAD为实验队列,GSE39582为验证队列。根据174个缺氧相关基因和517个铁死亡相关基因,通过Cox和LASSO回归分析构建风险评分预后模型,将数据中所有病患区分为高风险组和低风险组。随后进一步对两个风险组之间的临床和免疫特征进行综合分析,最后进行高低风险组之间的差异基因与结肠癌的GO(BP、MF、CC)和KEGG富集分析。结果 构建了包含9个基因(CDKN2A、FNDC5、ENO3、GSTM1、JDP2、ANGPTL4、ANKZF1、TKTL1、PPARGC1A)的风险评分模型。与高风险组相比,低风险组预后较佳,且高风险组的免疫细胞浸润水平高于低风险组。通过对高低风险评分组之间的差异基因进行GO分析及KEGG通路富集分析显示与MAPK信号通路、Rap1信号通路、趋化因子信号通路等肿瘤及免疫相关通路密切相关。结论 构建了缺氧条件下结合铁死亡的结肠癌患者风险评分模型,可为肿瘤的个体化治疗提供新的思路。
结肠癌(colon cancer)是发生于结肠部位的消化道恶性肿瘤,好发于直肠与乙状结肠交界处,40~50岁发病率最高[1]。结肠癌在全球癌症发生率中位居第三位,死亡率居第四位,是世界上最常见恶性肿瘤之一,并且其发生率还在呈逐年上升的趋势。预计至2030年全球将有超过220万新发病例和110万死亡病例[2]。对结肠癌发病机制中的关键调控分子及肿瘤微环境的研究对结肠癌的防治具有重要的理论价值。大量研究表明肿瘤的发生发展、复发转移与肿瘤所处的微环境密切相关。众所周知,低氧环境是一个重要的微环境,肿瘤缺氧主要是由于异常血管化导致的低氧供应与肿瘤细胞的高氧消耗之间存在的不均衡导致,而快速增殖肿瘤细胞会加速氧气的消耗,从而限制了可用于进一步扩散到肿瘤组织中的氧气量[3]。而癌症之所以难以根治,主要原因就是肿瘤细胞会不断适应所处的不良环境,缺氧能激活低氧诱导因子HIF(hypoxia-inducible factors)信号通路,加速肿瘤的生长,提高肿瘤的侵袭性,促使肿瘤发生转移[4]。
铁死亡(ferroptosis)是一种细胞内铁依赖性的细胞死亡形式,不同于细胞凋亡、细胞坏死和细胞自噬。铁死亡作为一种由铁催化、多不饱和脂肪酸的过度氧化介导的细胞调节性坏死,与癌症、神经退行性疾病和缺血、再灌注损伤等多种疾病有关[5]。大量研究报道指出,多种化合物和抗癌药物能够通过触发铁死亡来介导癌症进展[6-7]。因此,如何利用铁死亡途径有针对性地治疗不同类型的癌症已经逐渐成为癌症研究的关键问题之一[8]。但对缺氧条件下铁死亡相关基因与结肠癌的关系的研究尚未见报道。
本研究将基于数据挖掘技术探讨缺氧调控铁死亡参与结肠癌发生的机制,探索疾病背后可能的根本病因。通过Cox和LASSO回归分析构建风险评分预后模型,评估高低风险组在功能富集及免疫细胞浸润等方面的差异性。
1、数据采集与方法
整个分析的详细流程图如图1所示。
1.1数据采集
分别从癌症基因组图谱(TCGA)和基因表达综合数据库(Gene Expression Omnibus,GEO)的GSE39582数据集中获取514个及585个结肠癌患者的RNA-seq数据和相关临床病理信息,将结肠癌数据集(COAD)作为实验队列,GSE39582数据集作为外部验证队列。从细胞铁死亡基因数据库Ferr DB(http:∥www.zhounan.org/ferrdb/current)检索并下载了517个铁死亡相关基因,从Molecular Signatures Database下载174个缺氧相关基因。将来自两个数据库的基因表达数据通过R软件的“limma”进行标准化。
图1 分析工艺流程图
1.2风险模型的构建
对TCGA-COAD数据集使用单因素Cox回归分析(P<0.01)筛选了与铁死亡和缺氧相关预后基因26个,这26个预后基因的相关性网络证明它们之间是否具有较强的关联度。为消除过度拟合,将这26个与结肠癌患者预后显著相关的基因输入LASSO Cox回归模型,然后,通过多因素Cox回归分析构建缺氧和铁死亡相关的风险评分模型。
根据公式计算风险评分:风险评分=∑(Xi*Coef i)。
依据每个患者风险评分的最优cutoff值将患者分为两组,即高风险组和低风险组。使用R软件进行PCA分析,构建三维图,展示高低风险组的结肠癌患者是否能有效区分。采用时间依赖性受试者特征曲线(receiver operating characteristic curve,ROC)评估患者1、3、5年预后的可靠性,以特异性为横坐标、敏感性为纵坐标绘制成曲线,曲线下面积越大,诊断准确性越高。此外,本研究还通过ROC曲线考察风险评分是否保持并优于传统临床病理特征(年龄、性别、肿瘤分期、TNM分期)。最后,采用多因素Cox回归分析评估风险评分是否为独立预后因素,并综合考虑临床各项参数,如年龄、性别、分期和风险评分共同构建Nomogram列线图[9]。
1.3功能富集及临床性状分析
以FDR<0.05和|log2FC|>1为筛选条件,使用R软件“limma”包获得高、低风险组之间的显著差异表达基因。基于差异基因,利用R软件中“cluster Profiler”等程序包用于功能富集和通路分析,包括基因本体(GO)分析及京都基因和基因组通路百科全书(KEGG)通路富集分析[10]。
1.4免疫细胞浸润分析
已有研究[11]表明,铁死亡和缺氧均与免疫密切相关。因此,本研究使用单样本基因集富集分析(single sample gene set enrichment analysis,ss GSEA)来探索风险评分的高低是否与免疫细胞的浸润相关[12]。根据基因表达量,计算每个样本中16种免疫细胞的标准化ss GSEA评分,从而比较高、低风险组之间的免疫细胞浸润水平。P<0.05则表示差异具有统计学意义。
1.5统计学及方法分析
使用R 4.3.1软件进行统计分析及画图,使用R软件的“survival”包进行Kaplan-Meier分析[13]。使用R软件包“time ROC”进行ROC曲线分析以测试预测模型的灵敏度和特异性,并用于检验模型预测生存时间的准确性,比较各种风险因素的预测准确性。P<0.05表示差异具有统计学意义。
2、结果
2.1 TCGA及GEO队列中构建及验证风险评分模型
首先,基于517个铁死亡相关基因和174个缺氧相关基因进行单因素Cox回归分析筛选TCGA-COAD中铁死亡和缺氧相关预后基因(FHRGs)。在P<0.01的情况下,筛选了26个与结肠癌患者预后显著相关的FHRGs(见表1)。26个基因的相关性网络分析表明铁死亡相关基因(FRGs)和缺氧相关基因(HRGs)之间存在很强的相关性,且大部分呈正相关,仅PPARGCIA这个基因与大多数基因呈负相关(见图2A)。随后,将26个FHRGs输入到LASSO Cox回归分析中,最后通过多因素回归分析9个基因被纳入最佳的建模基因,大部分在肿瘤组织中高表达,PPARGCIA则在正常组织中高表达(见图2B)。使用以下公式可以获得风险评分:风险评分=∑[0.163 5*(CDKN2A表达量)+0.609 8*(FNDC5表达量)+0.677 3*(ENO3表达量)+0.176 2*(GSTM1表达量)+0.449 7*(JDP2表达量)+0.236 5*(ANGPTL4表达量)+0.512 8*(ANKZF1表达量)+0.246 7*(TKTL1表达量)-0.241 5*(PPARGC1A表达量)]。高、低风险组通过最优cutoff值来确定。PCA分析显示,低风险组和高风险组的结肠癌患者有明显的群体区分度(见图2C和图2D)。
表1 单因素Cox回归分析筛选的预后相关基因(P<0.01)
图2 风险评分建模
生存分析表明,低风险组的预后显著优于高风险组(P<0.05)(见图3A),且在GEO队列中得到验证(见图3B)。然后,绘制ROC曲线,通过曲线下面积(AUC)判断TCGA和GEO队列中风险评分的准确性,曲线下的面积越大,说明风险评分的准确性越高。在TCGA-COAD中,ROC曲线的1、3和5年AUC值分别为0.723、0.723、0.766,GEO队列验证AUC值均大于0.500(见图3C和图3D)。另外,风险评分和其他的临床特征相比较,可以看出风险评分模型较其他临床指标更具备优越性(AUC=0.766),能更好地预测患者的生存状态(见图3E)。
2.2结肠癌患者单因素及多因素独立预后分析
采用单因素和多因素分析共同比较临床相关特征,如年龄、性别、分期和风险评分与预后的关系见图4。结果证实,从单因素独立预后分析的结果可以看出风险评分、年龄、分期(T、N、M)和肿瘤分级可作为独立预后因子(见图4A)。但多因素独立预后分析发现,仅风险评分、年龄、T分期这3个临床特征与患者生存时间显著相关(P<0.05),可作为预测结肠癌预后的独立因素(见图4B)。综合单因素和多因素独立预后分析的结果,风险评分较其他临床参数作为预测患者生存时间的独立预后因素还是具备一定优势。HR>1表示为高风险因素,HR<1表示为低风险因素。
图3 风险评分优越性验证
2.3 Nomogram列线图的构建及预测能力评估
将性别、年龄、TNM分期、STAGE肿瘤分级等纳入Nomogram中构建出评估预后的风险评分模型。如图5A所示,针对每一位患者对模型中的每个变量进行评分,然后将所有变量得分相加,得到的总分所对应的百分比就是结肠癌患者的1、3及5年生存率。如一号患者总分447分,1年的生存率可达21.3%,3年的生存率可达45.3%,5年的生存率可达65.5%。Nomogram校准曲线证明本预后模型有较好的预测能力(见图5B)。
图4 风险评分和临床因素的回归分析
图5 Nomogram列线图的构建及预测能力评估
2.4风险评分与免疫细胞浸润的关系
使用ss GSEA比较高低两个风险组之间在16种常见类型的免疫细胞浸润之间的差异。如图6所示,大部分免疫细胞在高低两个风险组之间存在显著差异,并且在高风险组中大多数免疫细胞呈较高浸润。
图6 高低风险组间免疫细胞浸润的差异
2.5功能富集分析
为了进一步探索与高低风险组之间差异基因相关的生物学功能和信号通路,基于TCGA队列进行了GO和KEGG分析。GO富集分析结果显示,差异基因在activation of immune response,immune response-activating signaling pathway,regulation of T cell activation等生物过程中显著富集,这些都是与肿瘤免疫相关的功能(见图7A)。KEGG通路富集显示,高低风险组之间的差异基因显著富集在MAPK signaling pathway,Rap1 signaling pathway,Chemokine signaling pathway,这些也是与肿瘤和免疫相关的通路(见图7B)。
图7 功能富集分析
3、讨论
铁死亡是近年来在医学研究领域新发现的区别于细胞凋亡和细胞自噬的一种程序性死亡方式。越来越多的研究证实铁死亡相关基因在各类肿瘤的发生、发展中起着举足轻重的作用,被认为可预测肿瘤的预后,如FTH1[14]、NCOA4[15]、SLC7A11[16]、HMOX1[17]等基因。且铁死亡与肿瘤抑制及免疫显著相关,诱导肿瘤细胞铁死亡被认为是治疗肿瘤的有效方法。同时,缺氧条件下的肿瘤细胞铁死亡会受到抑制,但其分子机制并不清楚,且缺氧条件下的铁死亡对结肠肿瘤的影响尚未见研究。
本研究基于缺氧和铁死亡相关基因利用单因素Cox回归分析筛选结肠癌相关预后基因,然后,利用LASSO Cox回归分析消除过度拟合,最后通过多因素回归分析构建了一个包含9个核心基因的风险预后模型。根据风险评分将所有样本分为高、低风险两组。通过生存分析发现,低风险组的生存时间及生存率显著高于高风险组,预后良好。9个建模基因中,大部分基因在肿瘤组织中高表达,但缺氧基因PPARGCIA则在正常组织中高表达,且与其他基因呈明显的负相关性。笔者前期的研究[18]中通过RT-PCR实验已验证,CDKN2A在结肠肿瘤细胞中高表达;而PPARGCIA较结肠肿瘤细胞而言,在正常细胞中高表达。ROC分析及单因素和多因素Cox回归分析的结果表明,风险评分可以作为独立预后的有效指标。本研究所建立的Nomogram模型将性别、年龄、TNM分期、STAGE肿瘤分级及风险评分共同融入构建出预后的风险评分模型,可预测每一位患者在不同时间的生存百分比。同时,GO分析及KEGG通路富集分析显示风险评分相关基因与肿瘤及免疫功能密切相关,且低风险和高风险人群的免疫细胞浸润程度也呈现出明显的差异性,提示高风险组可能对免疫治疗有更高的敏感性。这意味着本研究的风险评分模型可以有效评估结肠癌患者缺氧状态下的铁死亡,指导患者的个体化治疗,并为进一步探索缺氧和铁死亡之间的机制提供依据。
参考文献:
[1]李祎琪,杨健康,王小燕.铁死亡相关基因与结肠癌分型及预后的关系研究[J].基因组学与应用生物学,2022,41(7):1590-1601.
[3]姜帆.几种肿瘤微环境响应的多功能纳米复合体系的构建及应用[D].合肥:中国科学技术大学,2022.
[4]谭钦文,杜沅沁,徐健,等.肝癌干细胞的有氧糖酵解特性及其在肿瘤微环境中的适应性机制[J].生命的化学,2023,43(2):187-195.
[5]袁静,王海燕,邢永华,等.基于铁死亡调控的癌症治疗研究进展[J].实用肿瘤杂志,2023,38(1):73-79.
[8]蔡招聘,管观文,陈佑甲,等. 2003—2022年我国结直肠癌研究的文献计量分析[J].浙江师范大学学报(自然科学版),2024,47(1):46-54.
[13]杨纯博.肝细胞癌中缺氧和铁死亡相关的基因预后模型的构建与验证[D].沈阳:中国医科大学,2023.
基金资助:江汉大学校级学生科研项目(2023yb167);
文章来源:杨光,田瑶,谢寒丹.基于数据挖掘的缺氧调控铁死亡参与结肠癌发生机制研究[J].江汉大学学报(自然科学版),2024,52(06):77-86.
分享:
大肠癌是一种常见的消化道恶性肿瘤,分为近端结肠癌、远端结肠癌、远端直肠癌3种亚型。近年来大肠癌发病率及死亡率呈上升趋势,大肠癌新增病例从2015年的38.8万例增长至2020年的55.5万例。此外,大肠癌也是中国癌症死亡的主要原因,死亡率约为28.6%。寻找危害性较小的有效治疗手段仍是目前大肠癌研究的重点。
2025-05-06结直肠癌的发病率随年龄的增长而上升,年龄&lt;50岁人群发病率较低,而年龄≥50岁呈现快速上升的趋势。因此,年龄≥50岁人群是结直肠癌筛查的重点人群[4-6]。结肠镜检查是整个结直肠癌筛查流程的核心环节,对早期发现并治疗癌前病变及降低结直肠癌发病率有重要意义。
2025-05-06结直肠癌是一种常见的消化道肿瘤,发病隐匿性较高,大部分患者确诊时疾病已发展至中晚期,存在淋巴结转移等不良情况,因此治疗难度大。慢性肾脏病(chronickidneydisease,CKD)是多种癌症的并发症,有研究显示,约有10%结直肠癌患者合并CKD。肾脏功能障碍会对患者免疫功能和机体的能量、营养均造成消极影响,进而导致多种并发症的发生。
2025-04-17大量研究表明,人乳头瘤病毒( human papillomavirus,HPV)感染是器官恶性肿瘤的主要病因,与全球约 5% 的癌症发生发展密切相关。 在 HPV感染中,HPV16 是最常见的高危型,其癌基因 E6 与肿瘤增殖、凋亡、侵袭和迁移密切相关[3-5]。最近的研究显示,结直肠癌( colorectal cancer,CRC)存在较高的 HPV16 感染率,两者间存在密切的相关性。
2025-03-28在结直肠癌的治疗方案中,手术切除作为主要手段,虽然疗效显著,但术后并发症问题仍需重视。肺部感染和肠梗阻是结直肠癌术后常见并发症,发生率分别为1.3%~18.6%和2.94%~44.12%,这些并发症可显著影响患者康复进程[1-2]。中医学理论认为,肺主气、司呼吸,与大肠相关[3-4]。
2025-03-26结直肠癌作为全球范围内发病率较高的恶性肿瘤之一,对公共健康构成了重大挑战。由于其高发病率和较高的术后并发症风险,结直肠癌的治疗及术后管理一直是医学研究的重点。老年衰弱患者因其生理功能下降,更易发生术后肺部并发症,如肺炎、低氧血症及呼吸衰竭,这些并发症不仅延长了患者的住院时间,也增加了治疗成本与死亡风险,给患者及其家庭带来了重大负担。
2025-03-17结直肠癌发病率较高,其发病机制复杂,通常涉及遗传、环境、生活方式等多种因素,常见症状包括便血、排便习惯改变、腹痛体重下降、贫血等,手术切除是最常用的治疗方法,晚期或转移性结直肠癌的患者多采用放射治疗、化学药物治疗与靶向治疗等手段[1]。
2025-02-21结直肠癌(colorectalcancer,CRC)是消化系统常见的恶性肿瘤之一[1]。2020年我国结直肠癌发病率和死亡率分别居所有恶性肿瘤的第二位和第五位[2-3],严重威胁着人类的身体健康。另有数据[4]显示,55岁以下人群的结直肠癌发病率正以每年2%的速度上升,中青年结直肠癌患者人数逐年增多[5]。
2025-02-14全球癌症报告[1]显示,结直肠癌新发病例约192万,死亡人数约90万。我国结直肠癌新发病例约51.71万例,死亡人数约24万例[2]。研究[3-4]表明,结直肠癌患者在患癌后存在不同程度的情绪困扰,包括焦虑、抑郁、孤独等。孤独与癌症发病率增加有关,孤独感会降低癌症患者的生活质量、增加死亡风险[5]。
2025-02-14结肠癌是由小肠上皮细胞发生病变或遗传基因导致的恶性肿瘤,由于症状隐匿性较强,常被误诊为肠炎,被发现时已发展至晚期,此时需采用化疗治疗[1]。FOLFIRI是治疗消化道肿瘤常用化疗方案,已被证明可有效抑制晚期结肠癌患者肿瘤扩散和增殖,但存在耐药性低、不良反应明显及疗效较低等问题[2]。
2025-02-13人气:18591
人气:16085
人气:14930
人气:14094
人气:11666
我要评论
期刊名称:实用肿瘤杂志
期刊人气:1500
主管单位:中华人民共和国教育部
主办单位:浙江大学
出版地方:浙江
专业分类:医学
国际刊号:1001-1692
国内刊号:33-1074/R
邮发代号:32-87
创刊时间:1986年
发行周期:双月刊
期刊开本:大16开
见刊时间:10-12个月
影响因子:1.474
影响因子:2.876
影响因子:0.899
影响因子:0.000
影响因子:2.153
400-069-1609
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!