摘要:目的 基于机器学习算法筛选肥厚性心肌病(HCM)铁死亡的潜在疾病特征基因。方法 从基因表达数据库(GEO)中下载GSE36961、GSE141910数据集,其中GSE36961数据集包括106例HCM患者和39例健康对照者,作为训练集;GSE141910数据集包括28例HCM患者和166例健康对照者,作为测试集。使用R语言“limma”包筛选GSE36961数据集中HCM患者与健康对照者之间的差异表达基因(DEGs),然后与铁死亡数据库(FerrDb)中的259个铁死亡相关基因取交集,以筛选HCM铁死亡相关DEGs。采用随机森林筛选疾病特征基因,绘制热图以分析疾病特征基因在测试集中的表达情况,并基于疾病特征基因构建人工神经网络(ANN)模型;绘制ROC曲线以评估ANN模型对训练集、测试集HCM的预测价值。结果 从GSE36961数据集中筛选出2 959个DEGs,与铁死亡数据库中259个铁死亡相关基因取交集后获得72个HCM铁死亡相关DEGs。采用随机森林从72个HCM铁死亡相关DEGs中筛选出9个疾病特征基因,分别为ALOX5、ZFP36、RGS4、DDIT3、LPCAT3、SOCS1、EGLN2、NNMT和DUSP1。热图分析结果显示,RGS4、DDIT3表达上调,ALOX5、ZFP36、LPCAT3、SOCS1、EGLN2、NNMT、DUSP1表达下调。基于9个疾病特征基因构建ANN模型。ROC曲线分析结果显示,ANN模型预测训练集HCM的AUC为1.000[95%CI(0.998~1.000)],预测测试集HCM的AUC为0.817[95%CI(0.745~0.881)]。结论 ALOX5、ZFP36、RGS4、DDIT3、LPCAT3、SOCS1、EGLN2、NNMT和DUSP1是HCM铁死亡的潜在疾病特征基因。
加入收藏
肥厚性心肌病(hypertrophic cardiomyopathy,HCM)是一种常见的显性基因遗传病[1,2],其患病率约为2‰,可导致多种合并症,包括舒张功能障碍、恶性心律失常甚至猝死,给医疗卫生系统带来了负面影响[3]。目前,导致HCM发病的遗传和微环境因素仍不甚清楚,需要进一步探究其潜在发病机制,以推动HCM的精准诊治。铁死亡是一种与铁离子有关的、非凋亡的程序性细胞坏死[4,5,6]。研究表明,铁死亡在HCM或扩张型心肌病等心血管疾病中可能发挥促进疾病进展的作用[7,8]。因此,调节铁死亡可能对HCM具有治疗潜力[9]。本研究通过分析HCM患者与健康对照者的心肌组织转录谱数据及结合铁死亡相关基因,筛选出HCM铁死亡相关差异表达基因(differentially expressed genes,DEGs);然后,采用机器学习算法中的随机森林(random forest,RF)[10]和人工神经网络(artificial neural network,ANN)[11]筛选疾病特征基因,现报道如下。
1、对象与方法
1.1数据集信息
从基因表达数据库(Gene Expression Omnibus,GEO)(https://www.ncbi.nlm.nih.gov/geo/)[12]中下载GSE36961、GSE141910数据集,均为来源于HCM患者和健康对照者的心肌组织转录谱数据。其中GSE36961数据集包括106例HCM患者和39例健康对照者,作为训练集;GSE141910数据集包括28例HCM患者和166例健康对照者,作为测试集。
1.2 HCM铁死亡相关DEGs的筛选
使用R语言“limma”包筛选GSE36961数据集中HCM患者与健康对照者之间的DEGs[13],筛选标准:|log2倍数变化(fold change,FC)|>1且P<0.05。然后将GSE36961数据集中的DEGs与铁死亡数据库(Ferr Db)中的259个铁死亡相关基因取交集,以筛选HCM铁死亡相关DEGs,并使用“Venn Diagram”包绘制韦恩图。
1.3 HCM铁死亡相关DEGs富集分析
利用在线工具Metascape(https://metascape.org/gp/index.html#/main/step1)[14]对HCM铁死亡相关DEGs进行综合富集分析。同时为了多个维度佐证综合富集分析结果,使用R软件“cluster Profiler”包对HCM铁死亡相关DEGs进行GO功能富集分析[15]和KEGG通路富集分析[16,17]。其中GO功能富集分析包括生物过程(biological process,BP)、细胞组分(cellular component,CC)和分子功能(molecular function,MF),主要阐明基因在细胞中发挥的功能、分子活动和参与细胞组分的角色[18];KEGG通路富集分析主要探索基因可能涉及的代谢或信号通路。以P<0.05为差异有统计学意义。
1.4疾病特征基因的筛选及验证
应用R 4.1.1软件中“random forest”包筛选重要性排序前30位的HCM铁死亡相关DEGs,然后筛选平均Gini指数下降值>2的DEGs作为疾病特征基因。
应用R 4.1.1软件中“pheatmap”包绘制训练集中疾病特征基因热图。然后将疾病特征基因在数据集中的表达数据转换为“基因评分”表[19]。转换规则:若某一上调基因在某一样本中的表达值高于该基因在所有样本中的表达中值,则其基因评分为1分,否则为0分;若某一下调基因在某一样本中的表达值高于该基因在所有样本中的表达中值,则其基因评分为0分,否则为1分。将疾病特征基因的基因评分作为自变量,疾病状态作为因变量(赋值:HCM=1,健康对照=0)。应用“neuralnet”包、“Neural Net Tools”包构建ANN模型。最后,应用“p ROC”包绘制ROC曲线以评估ANN模型对训练集、测试集HCM的预测效能。
2、结果
2.1 HCM铁死亡相关DEGs
从GSE36961数据集中筛选出2 959个DEGs,其中上调DEGs 1 443个、下调DEGs 1 516个。将GSE36961数据集中2 959个DEGs与铁死亡数据库中259个铁死亡相关基因取交集后获得72个HCM铁死亡相关DEGs,见图1。
2.2 HCM铁死亡相关DEGs富集分析结果
Metascape综合富集分析结果显示,HCM铁死亡相关DEGs主要参与铁死亡、细胞的应激反应、对营养或氧水平的应答、白介素(interleukin,IL)-4信号通路、IL-13信号通路,见图2。GO功能富集分析结果显示,HCM铁死亡相关DEGs主要参与对饥饿/营养水平/胞外刺激的应答、对氧化应激的细胞应答,见图3。KEGG通路富集分析结果显示,HCM铁死亡相关DEGs主要参与缺氧诱导因子(hypoxia-inducible factor,HIF)-1、铁死亡、自噬信号通路,见图4。
2.3疾病特征基因筛选结果
RF分析结果显示,交叉验证误差最小的点对应的树的数目为55,再筛选重要性排序前30位的DEGs,其中Gini指数下降值>2的DEGs共9个,分别为ALOX5、ZFP36、RGS4、DDIT3、LPCAT3、SOCS1、EGLN2、NNMT和DUSP1,见图5~6。
2.4疾病特征基因验证结果
热图分析结果显示,在9个疾病特征基因中,RGS4、DDIT3表达上调,ALOX5、ZFP36、LPCAT3、SOCS1、EGLN2、NNMT、DUSP1表达下调,见图7。基于9个疾病特征基因构建ANN模型,见图8。ROC曲线分析结果显示,ANN模型预测训练集HCM的AUC为1.000[95%CI(0.998~1.000)],预测测试集HCM的AUC为0.817[95%CI(0.745~0.881)],见图9。
图1 GSE36961数据集中DEGs与铁死亡数据库中铁死亡相关基因的韦恩图
3、讨论
目前普遍认为,HCM主要由基因突变引起,但其具体发病机制尚未阐明。铁死亡作为一种铁离子相关的、非凋亡的程序性细胞坏死形式,可能参与HCM的发生发展。本研究共筛选出72个HCM铁死亡相关DEGs,并对其进行Metascape综合富集分析、GO功能富集分析和KEGG通路富集分析,结果显示,HCM铁死亡相关DEGs主要参与铁死亡、细胞的应激反应、对营养或氧水平/饥饿/胞外刺激的应答、对氧化应激的细胞应答等BP及IL-4、IL-13、HIF-1、铁死亡、自噬信号通路,提示HCM铁死亡相关DEGs可能在HCM的发生发展中发挥着重要作用。研究表明,铁平衡可以维持心功能,而铁缺乏或铁超载均与心肌病的发生相关[20]。动物实验证实,高铁饮食能通过诱导铁死亡而导致铁蛋白基因敲除小鼠发生HCM;而铁死亡抑制剂氟伐他汀能逆转HCM表型,提示铁死亡是HCM的发病机制之一,而针对铁死亡的治疗可能是HCM的防治靶点[9]。氨基酸转运蛋白(SLC7A11/x CT)作为另一种铁死亡抑制剂也能起到预防心肌肥大的作用[8]。氧化应激是铁死亡过程的重要环节[21],研究表明,HCM细胞和动物模型氧化应激水平明显升高[9,22],HCM患者氧化应激标志物(如氧化的蛋白质、DNA、脂质)亦明显升高[23,24,25],而抗氧化物质(如超氧化物歧化酶)可能延缓HCM的进展[26]。提示氧化应激在HCM的发病中发挥着重要作用。
本研究基于RF筛选出9个疾病特征基因,分别为ALOX5、ZFP36、RGS4、DDIT3、LPCAT3、SOCS1、EGLN2、NNMT和DUSP1,并基于上述疾病特征基因构建了ANN模型;ROC曲线分析结果显示,ANN模型预测训练集HCM的AUC为1.000,预测测试集HCM的AUC为0.817,提示基于9个疾病特征基因构建的ANN模型对HCM具有良好的预测价值,再次佐证上述9个DEGs是HCM铁死亡的疾病特征基因。其中ALOX5是一类催化白三烯生物合成的非血红素含铁双加氧酶,在人类肥厚心脏标本中其表达明显上调。基础实验表明,特异性敲除心肌细胞ALOX5可减轻心肌肥厚,而其过表达可强化心肌肥厚表型;ALOX5的致病作用可能与其促进运行结合因子2特殊结构域的液-液相分离、增加表皮生长因子受体表达有关[27]。RGS家族成员是异源三聚体G蛋白中Gα亚基的三磷酸鸟苷酶激活蛋白的调控分子。研究表明,RGS4在心肌肥厚动物模型中表达上调[28],本研究结果与其一致。但也有研究报道,RGS4表达水平升高通过抑制G蛋白信号、降低肥厚基因表达而对肥厚的心肌发挥保护作用[29,30]。分析其机制为:RGS4通过蛋白酶体途径降解增加,引起G蛋白βγ亚基/磷脂酰肌醇3-激酶γ/蛋白激酶B/哺乳动物雷帕霉素靶蛋白复合物1通路被激活,进而促进心肌细胞增殖[31]。SOCS1在肥厚心脏中表达降低[32],本研究结果与其一致,其潜在机制可能涉及抑制信号转导和转录激活子3的磷酸化及与mi RNA-155的相互作用有关[32,33]。基础实验发现,DUSP1作为双特异性磷酸酶家族的成员之一,能通过促使有丝分裂原激活蛋白激酶末端效应子失活而发挥心脏保护作用[34]。另有研究报道,LPCAT3是HCM中与铁死亡相关的基因[7],NNMT在肥厚心脏中表达升高[35],ZFP36与心脏肥厚有关[36],但这些基因影响心肌肥厚或HCM疾病进程的分子机制尚不清楚。DDIT3和EGLN2与HCM的关系尚未见文献报道。
图2 HCM铁死亡相关DEGs的Metascape综合富集分析结果
图3 HCM铁死亡相关DEGs的GO功能富集分析结果
图4 HCM铁死亡相关DEGs的KEGG通路富集分析结果
图5 HCM铁死亡相关基因随机森林分析结果
图6 HCM铁死亡相关基因平均Gini指数下降值
图7疾病特征基因热图
图8 ANN模型
4、结论
综上所述,ALOX5、ZFP36、RGS4、DDIT3、LPCAT3、SOCS1、EGLN2、NNMT和DUSP1是HCM铁死亡的潜在疾病特征基因,可能成为HCM的诊治靶点。但本研究数据来源于公共数据集,且因国内心肌活检普及度欠佳,故本研究结果尚缺乏临床样本的进一步佐证。
图9 ANN模型预测HCM的ROC曲线
作者贡献:尤红俊、赵倩倩、苟棋玲、董梦雅进行文章的构思与设计;尤红俊、武锋超、刁佳宇、程功、董梦雅进行研究的实施与可行性分析、结果分析与解释;尤红俊、赵倩倩、苟棋玲、武锋超、刁佳宇、程功、董梦雅进行数据收集、整理、分析;尤红俊负责撰写、修订论文;董梦雅负责文章的质量控制及审校,并对文章整体负责、监督管理。
本文无利益冲突。
参考文献:
[20]刘科成,姚靖烨,章海燕,等.铁死亡与心血管疾病的关系及其靶向治疗[J].实用心脑肺血管病杂志,2023,31(5):1-6.
基金资助:陕西省人民医院2022年科技人才支持计划项目(菁英人才)资助项目(2022JY-45);陕西省人民医院2023年科技发展孵化基金资助项目(2023YJY-63);
文章来源:尤红俊,赵倩倩,苟棋玲,等.基于机器学习算法筛选肥厚性心肌病铁死亡的潜在疾病特征基因[J].实用心脑肺血管病杂志,2024,32(05):59-65.
分享:
睡眠障碍与心血管疾病的发病机制及临床转归存在显著相关性[4],这一现象在ACS患者中较为突出,最高发病率可达66.66%[5]。睡眠时间不足和睡眠质量下降不仅会加剧患者临床症状,更可能成为心血管事件复发及死亡风险的潜在诱因[6]。基于此,探究心血管疾病患者睡眠障碍的影响因素对其预后具有重要意义。
2025-09-05根据临床表现和解剖位置的不同,主动脉夹层可分为StanfordA型和StanfordB型两种类型,其中StanfordB型主动脉夹层(TypeBaorticdissection,TBAD)指的是夹层发生在主动脉弓以下,未累及升主动脉的部分[2]。尽管TBAD相较于A型夹层在治疗上相对简单,但其临床预后仍受到多种因素的影响。
2025-09-05院外心脏骤停(OHCA)是一种紧急医疗状况,具有极高的致死率和致残率,当其发生后,迅速识别并在第一时间开展心肺复苏,对于挽救患者生命至关重要。2020年美国心脏协会(AHA)心肺复苏指南强调,气道通畅的心脏骤停患者进行单纯球囊面罩和气管插管建立稳定气道,其抢救成功率无统计学差异。
2025-09-01心房颤动(简称房颤)是心功能不全患者的伴随症状之一,据统计有40.0%左右的发生率[1]。房颤将随着病情的发展导致心脏内血流动力学改变,从而加剧心脏重构,增加不良心脑血管疾病发生率,甚至威胁生命,因此,探寻新的、可调控的血清学标志物为房颤的防治提供指导成为重中之重。
2025-08-28冠状动脉粥样硬化性心脏病是最常见的心血管疾病,主要治疗手段包括基础药物治疗、冠状动脉介入治疗和冠状动脉旁路移植术(CoronaryArteryBypassGrafting,CABG)[1],其中经皮冠状动脉介入治疗(PercutaneousCoronaryIntervention,PCI)历经三十余年的快速发展,已成为当今冠心病重要的治疗手段[2]。
2025-08-28静息心率(RestingHeartRate,RHR)是一种敏感、无创且廉价的心脏功能指标,近年来受到广泛关注。RHR是交感神经系统活动的标志,其升高通常反映交感神经激活。流行病学和临床研究表明,RHR升高与心血管疾病(CardiovascularDisease,CVD)、代谢综合征及全因死亡率的风险增加密切相关[1-3]。
2025-08-28心力衰竭是一种常见的难治性心血管疾病,病理性心肌肥厚是导致心力衰竭的主要原因。病理性心肌肥厚涉及许多信号通路,例如丝裂原活化蛋白激酶(MAPK)、降钙素-活化T细胞的核因子(NFAT)和丝氨酸/苏氨酸蛋白激酶(AKT)信号通路,MAPK被认为是调控心肌肥厚的重要信号通路。
2025-08-23糖尿病是以高糖为特征的代谢性疾病,中国2021年20~79岁人群中糖尿病患者约有1.4亿例,其中95%以上为2型糖尿病(T2DM)。T2DM是动脉粥样硬化性心血管疾病(ASCVD)发病的独立危险因素,ASCVD也是导致T2DM患者致残和死亡的重要原因,并发ASCVD的T2DM患者死亡风险较一般人群增加1.90~2.26倍。
2025-08-20在临床上,CSX通常表现为用力时或静息胸痛、冠状动脉血流储备减少、微血管痉挛等典型的劳力型心绞痛症状,运动负荷试验显示ST段压低,但冠状动脉造影正常,且无其他特殊心脏疾病(如变异性心绞痛)[3]。国外最新统计,在接受冠状动脉造影的病人中,有10%~20%被确诊为CSX,但药物治疗CSX的效果欠佳[4]。
2025-08-19多项研究证实,心肌应变指标能够早于传统的左心室射血分数改变而出现异常,且应变值的降低与主要心血管不良事件的发生风险呈独立相关[2-5]。超声心动图斑点追踪和心脏磁共振(cardiacmagneticreso⁃nance,CMR)特征追踪(featuretracking,FT)技术是心肌应变测量的常用方法,但前者易受图像质量及探头角度影响,后者检查耗时长、成本高,不适用于部分存在禁忌症的患者。
2025-08-19人气:18388
人气:17804
人气:16683
人气:15149
人气:13992
我要评论
期刊名称:实用心脑肺血管病杂志
期刊人气:2381
主管单位:河北省卫生健康委员会
主办单位:河北省心脑肺血管病防治研究办公室
出版地方:北京
专业分类:医学
国际刊号:1008-5971
国内刊号:13-1258/R
邮发代号:80-684
创刊时间:1993年
发行周期:月刊
期刊开本:大16开
见刊时间:10-12个月
影响因子:0.000
影响因子:0.582
影响因子:1.464
影响因子:0.000
影响因子:0.623
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!