摘要:目的 基于生物信息学技术和机器学习算法筛选急性心肌梗死(AMI)核心基因,并采用细胞实验进行验证。方法 本实验时间为2021—2022年。从美国国立生物技术信息中心(NCBI)的高通量基因表达(GEO)数据库下载与AMI相关的3个m RNA基因芯片数据集(GSE34198、GSE66360和GSE83500),其中GSE66360和GSE83500为测试集,GSE34198为验证集。运用R 4.2.0软件中的“limma包”筛选GSE66360和GSE83500中差异表达基因。使用LASSO回归方法缩小差异表达基因的范围,然后使用支持向量机-递归特征消除(SVM-RFE)方法在差异表达基因中寻找特征基因,取两种机器学习算法的交集,即为核心基因。比较测试集中AMI组和对照组核心基因表达水平,绘制ROC曲线以评估核心基因表达水平对测试集、验证集受试者发生AMI的预测价值。将衰老心肌细胞随机分为正常氧组和缺氧/复氧组,其中正常氧组心肌细胞常规培养;缺氧/复氧组心肌细胞缺氧3 h后复氧2 h,以制备AMI细胞模型。采用q PCR法检测心肌细胞IL1R2、NR4A2、TREM1 m RNA相对表达量。结果 从GSE66360和GSE83500中筛选出145个AMI差异表达基因。在差异表达基因中,通过LASSO回归分析筛选出10个特征基因,通过SVM-RFE方法筛选出10个特征基因,取交集得到9个核心基因,分别为NFIL3、IL1R2、NR4A2、IRAK3、VCAN、CCL20、TREM1、LYZ、ITLN1。在测试集中,AMI组仅IL1R2、NR4A2、TREM1表达水平高于对照组(P<0.05)。ROC曲线分析结果显示,IL1R2、NR4A2、TREM1表达水平预测测试集受试者发生AMI的AUC分别为0.648[95%CI(0.534~0.756)]、0.623[95%CI(0.511~0.728)]、0.622[95%CI(0.502~0.730)];IL1R2、NR4A2、TREM1表达水平预测验证集受试者发生AMI的AUC分别为0.834[95%CI(0.761~0.898)]、0.866[95%CI(0.802~0.923)]、0.808[95%CI(0.729~0.880)]。缺氧/复氧组心肌细胞IL1R2、NR4A2、TREM1 m RNA相对表达量高于正常氧组(P<0.05)。结论IL1R2、NR4A2、TREM1是AMI核心基因,三者有望成为AMI潜在的生物标志物。
加入收藏
急性心肌梗死(acute myocardial infarction,AMI)指动脉内壁斑块导致流向心脏的血液减少甚至中断,进而使心肌细胞发生缺血缺氧性损伤[1]。但心肌细胞是永久性细胞,其损伤后一般不能再生[2],故早期筛查AMI高风险人群具有重要的现实意义。近年来生物信息学技术在疾病诊断和预测方面应用广泛,而基因代谢组学作为生物信息学技术,其主要探究基因与疾病的关系[3,4]。目前,基于基因代谢组学探究肝癌、胃癌等核心基因的文献较多[5,6],但应用该技术筛选AMI核心基因的报道较少。机器学习是基于数据构建的计算模型。本研究旨在通过生物信息学技术和机器学习算法筛选AMI核心基因并进行验证,现报道如下。
1、材料与方法
1.1实验时间
本实验时间为2021—2022年。
1.2采用生物信息学技术筛选差异表达基因
1.2.1数据来源
从美国国立生物技术信息中心(National Center for Biotechnology Information,NCBI)的高通量基因表达(Gene Expression Omnibus,GEO)数据库(https://www.ncbi.nlm.nih.gov/geo/)下载与AMI相关的3个m RNA基因芯片数据集(GSE34198、GSE66360和GSE83500),其中GSE66360[非AMI患者20例(对照组),AMI患者17例(AMI组)]和GSE83500[健康对照者46例(对照组),AMI患者49例(AMI组)]为测试集,GSE34198[健康对照者46例(对照组),AMI患者49例(AMI组)]为验证集。
1.2.2筛选差异表达基因
运用R 4.2.0软件中的“limma包”,以|log2FC|>1、P<0.05为标准,筛选GSE66360和GSE83500中差异表达基因。
1.2.3 GO功能富集分析、KEGG通路富集分析
应用差异表达基因数据软件对差异表达基因进行GO功能富集分析,分析其主要富集的生物过程(biological process,BP)、细胞成分(cellular component,CC)、分子功能(molecular function,MF);通过Metascape官网(https://metascape.org)对差异表达基因进行KEGG通路富集分析。
1.3采用机器学习算法筛选核心基因
使用LASSO回归方法缩小差异表达基因的范围,然后使用支持向量机-递归特征消除(support vector machine-recursive feature elimination,SVM-RFE)方法在差异表达基因中寻找特征基因,取两种机器学习算法的交集,即为核心基因。
1.4核心基因表达水平及预测能力
比较测试集中AMI组和对照组核心基因表达水平,绘制ROC曲线以评估核心基因表达水平对测试集、验证集受试者发生AMI的预测价值,AUC为0.5~1.0,其值越大提示核心基因表达水平对AMI的预测价值越高。
1.5细胞实验验证核心基因
1.5.1实验细胞
大鼠心肌细胞株H9C2购自武汉普诺赛生物科技有限公司。
1.5.2主要实验试剂与仪器
胎牛血清(G i b c o,美国),D M E M培养基(Gibco,美国),总RNA提取试剂盒(Axygen,美国),Prime Script™RT reagent Kit(Takara,日本),TB Green®Premix Ex Taq™Ⅱ(Takara,日本),IL1R2、NR4A2、TREM1引物[生工生物工程(上海)股份有限公司];微量台式离心机(5810R)(Eppendorf,德国),荧光定量PCR仪(Applied Biosystems)(德国耶拿分析仪器股份公司),厌氧培养袋及厌氧产气包(Anaero Pack-Anaero)(三菱公司,日本)。
1.5.3细胞培养
采用含10%胎牛血清的DMEM培养液培养心肌细胞,将其置于37℃、95%O2、5%CO2培养箱中培养,当细胞汇合度达80%左右时进行传代。
1.5.4构建衰老心肌细胞模型及分组
采用D-半乳糖8 mg/ml刺激第2代心肌细胞9 d以制备衰老心肌细胞。将衰老心肌细胞按5×106个的数量接种到25T培养瓶中,然后随机将其分为正常氧组和缺氧/复氧组,其中正常氧组心肌细胞常规培养;缺氧/复氧组心肌细胞缺氧3 h后复氧2 h,以制备AMI细胞模型。
1.5.5 q PCR法检测IL1R2、NR4A2、TREM1 m RNA相对表达量
在25T培养瓶中收集正常氧组和缺氧/复氧组心肌细胞,按照总RNA提取试剂盒说明书提取细胞总RNA,将RNA反转录成c DNA,采用2-ΔΔCt法计算IL1R2、NR4A2、TREM1 m RNA相对表达量。基因引物序列和产物长度见表1,扩增条件见表2。实验独立重复9次。
表1基因引物序列和产物长度
表2基因引物扩增条件
1.6统计学方法
采用Graph Pad Prism 6.0统计学软件进行数据处理。计量资料以(±s)表示,两组间比较采用成组t检验。以P<0.05为差异有统计学意义。
2、结果
2.1差异表达基因筛选结果
从GSE66360和GSE83500中筛选出145个AMI差异表达基因,其中上调差异表达基因125个、下调差异表达基因20个,见图1。
图1差异表达基因的火山图
注:红色圆点为上调差异表达基因,绿色圆点为下调差异表达基因,黑色圆点为非差异表达基因。
2.2 GO功能富集分析结果
GO功能富集分析结果显示,差异表达基因主要涉及的BP为细菌的防御反应、中性粒细胞趋化性、粒细胞趋化性、中性粒细胞迁移、粒细胞迁移、骨髓白细胞迁移、白细胞趋化性、细胞对白介素1的反应、白介素1介导的信号通路;主要涉及的CC为三级颗粒、特殊颗粒、分泌颗粒管腔、细胞质小泡腔、富含纤维胶凝蛋白1的颗粒膜、特殊颗粒管腔、三级颗粒膜、液泡管腔;主要涉及的MF为碳水化合物的结合物、免疫受体活性、晚期糖基化终末产物受体结合物、Ig G结合物、病毒颗粒结合物、细胞核糖皮质激素受体结合物、肽聚糖溶血活性、核视黄醇X受体结合物、低聚糖结合物、调理素结合物。
2.3 KEGG通路富集分析结果
KEGG通路富集分析结果显示,差异表达基因主要涉及的信号通路为天然免疫反应应答、吞噬细胞杀伤的正性调节的信号通路。
2.4核心基因
在差异表达基因中,通过LASSO回归分析筛选出10个特征基因,见图2;通过SVM-RFE方法筛选出10个特征基因,见图3;取交集得到9个核心基因,分别为NFIL3、IL1R2、NR4A2、IRAK3、VCAN、CCL20、TREM1、LYZ、ITLN1,见图4。
图2差异表达基因的LASSO回归分析结果
图3差异表达基因的SVM-RFE方法分析结果
图4差异表达基因的韦恩图
2.5 AMI核心基因表达水平及其预测价值
在测试集中,AMI组仅IL1R2、NR4A2、TREM1表达水平高于对照组,差异有统计学意义(P<0.05),见图5。ROC曲线分析结果显示,IL1R2、NR4A2、T R E M 1表达水平预测测试集受试者发生A M I的AUC分别为0.648[95%CI (0.534~0.756)]、0.623[95%CI(0.511~0.728)]、0.622[95%CI(0.502~0.730)],见图6;IL1R2、NR4A2、T R E M 1表达水平预测验证集受试者发生A M I的AUC分别为0.834[95%CI (0.761~0.898)]、0.866[95%CI(0.802~0.923)]、0.808[95%CI(0.729~0.880)],见图7。
2.6 q RT-PCR法验证核心基因m RNA相对表达量
缺氧/复氧组心肌细胞IL1R2、NR4A2、TREM1m RNA相对表达量高于正常氧组,差异有统计学意义(P<0.05),见表3。
表3正常氧组与缺氧/复氧组心肌细胞IL1R2、NR4A2、TREM1m RNA相对表达量比较(±s,n=9)
3、讨论
AMI发病迅速且具有较高的死亡率[7,8]。目前,冠状动脉造影是诊断AMI的“金标准”,但其属于有创检查,故寻找AMI非创伤性诊断方法具有临床价值。本研究通过生物信息学技术和机器学习算法筛选出9个AMI核心基因,且在测试集中,AMI组仅IL1R2、NR4A2、TREM1表达水平高于对照组;ROC曲线分析结果显示,IL1R2、NR4A2、TREM1表达水平预测测试集受试者发生AMI的AUC分别为0.648、0.623、0.622,三者预测验证集受试者发生AMI的AUC分别为0.834、0.866、0.808;且缺氧/复氧组心肌细胞IL1R2、NR4A2、TREM1 m RNA相对表达量高于正常氧组,提示IL1R2、NR4A2、TREM1是AMI核心基因。
R O N G等[9]研究表明,I L 1 R 2基因多态性(rs11674595、rs4851527、rs2072472和rs3218977)可能与中国汉族人群骨质疏松症的发病有关,但其在AMI中的作用有待深入挖掘。NR4A2属于核受体4A亚家族,其编码类固醇甲状腺激素类维生素A受体,是核受体转录因子,而核受体转录因子在哺乳动物神经元发育、炎症、记忆形成等方面具有调节作用。研究表明,NR4A2基因突变与癫痫发作、神经发育异常和机体发育异常有关[10,11,12,13]。KARKI等[14]研究表明,NR4A2在胶质母细胞瘤中是促癌基因,且其在心血管应激反应中具有重要作用。ASHRAF等[15]研究表明,在成年哺乳动物心脏,特别是在心肌细胞中,在β-肾上腺素能刺激下NR4A2表达明显上调,其特异性过表达导致终末分化的心肌细胞重新进入细胞周期和DNA复制增加,但不导致心肌细胞分裂。TREM1是髓样细胞触发性受体家族成员,属于免疫球蛋白超家族受体,其主要功能是识别外源性抗原和毒性物质,从而调节炎症反应[16]。LIU等[17]研究表明,TREM1放大了脑源性和肠源性免疫原性成分的促炎反应,在TREM1上表达的触发受体可在多种心血管疾病中驱动炎症反应。VANDESTIENNE等[18]研究表明,TREM1可参与腹主动脉瘤的病理生理过程。KIMMOUN等[19]研究表明,TREM1与心源性休克患者90 d死亡率和各种器官损伤有关,但其在AMI中的具体分子机制尚不清楚。
图5测试集中对照组与AMI组IL1R2、NR4A2、TREM1表达水平比较的箱式图
图6 IL1R2、NR4A2、TREM1表达水平预测测试集受试者发生AMI的ROC曲线
图7 IL1R2、NR4A2、TREM1表达水平预测验证集受试者发生AMI的ROC曲线
4、结论
综上所述,IL1R2、NR4A2、TREM1是AMI核心基因,三者有望成为AMI潜在的生物标志物。但本研究仍存在一定局限性:(1)无法阐明IL1R、NR4A2、TREM1导致AMI的具体机制;(2)无法明确IL1R、NR4A2、TREM1是否与其他组学有关,如代谢组学、蛋白组学等。
作者贡献:李淑娟进行文章的构思与设计,负责撰写、修订论文;柯妍进行研究的实施与可行性分析;刘旭东、贺茜、徐遥琴进行数据收集、整理、分析;田宇佳、卢冠军、马娟、朱澈进行结果分析与解释;汪乐新负责文章的质量控制及审校,并对文章整体负责、监督管理。
基金资助:国家自然科学基金资助项目(82060139);宁夏自然科学基金一般项目(2023AAC03679);
文章来源:李淑娟,柯妍,刘旭东等.基于生物信息学技术和机器学习算法筛选急性心肌梗死核心基因[J].实用心脑肺血管病杂志,2024,32(03):33-38.
分享:
经皮冠状动脉介入治疗(PCI)作为一种常见且有效的治疗方法,能够有效改善急性心梗患者的血流动力学状态,缓解心肌缺血,减少心肌损伤[2]。然而,部分急性心梗患者合并严重的心功能不全,尤其是伴有心源性休克的患者,单纯依靠PCI治疗效果有限,常常需要其他辅助治疗措施来改善其预后。
2025-09-05急性心肌梗死(AMI)是一种心脏疾病,其发生原因是冠状动脉突然闭塞,导致心肌因缺血而发生坏死,其临床表现主要包括胸痛、胸闷以及心悸等症状。[1]。此病具有高发病率、高致残率和高死亡率的特点,严重威胁患者的生命健康[2]。随着医疗技术的不断进步,AMI的治疗手段日益丰富,但护理和康复环节的重要性也日益凸显。
2025-09-05急性心肌梗死患者的病情比较危重,随时可能会出现病情的变化,病死率相对较高,在为患者实施急诊治疗的过程中为了避免各种不良情况的出现,及时、有效的为患者提供抢救就需要以护理作为依托,在这样的情况下就应该分析更好的急诊护理方法[3]。
2025-09-03骨髓增生异常综合征(myelodysplasticsyn-dromes,MDS)是一组起源于造血干细胞的异质性髓系克隆性疾病,中位发病年龄约70岁,对于较高危MDS患者而言,异基因造血干细胞移植(alloge-neichematopoieticstemcelltransplantation,allo-HSCT)是唯一可能根治的有效手段。近年来,随着预处理方案不断优化和移植并发症管理措施不断完善,移植相关死亡率明显下降。
2025-09-01患者发病急骤,24h内为不稳定期,易并发心力衰竭、心律失常等严重并发症,即便及时治疗仍可能遗留后遗症,甚至危及生命[1-2]。临床常采用经皮冠状动脉介入治疗(PCI)、溶栓等治疗方法,其中PCI术可实现心肌再灌注、开通闭塞冠状动脉,缩小梗死范围,降低心肌重塑率,改善患者预后[3-4]。
2025-09-01作为常见的心血管急症,急性心肌梗死具有发病急、病情危重、死亡率高等特点,在我国发病率约为79.7/10万[1]。该病主要因粥样硬化斑块破裂而使冠状动脉(冠脉)闭塞所致,进而引发心肌坏死,临床表现为突发胸痛,不仅发病时病死率高,存活者也可能因心肌受损严重,引发心力衰竭、心律失常等并发症。
2025-08-28心肌梗死后,心肌细胞因缺血缺氧发生不可逆损伤,进而影响心脏泵血功能,导致心力衰竭等严重并发症[1-2]。传统心肌梗死治疗主要依赖药物和介入手术,但对心功能的恢复和运动耐力的提升效果有限[3]。近年来,心脏康复作为综合治疗手段,通过运动训练、心理干预及生活方式调整,被证实可改善患者预后[4]。
2025-08-27心电图是医院最简便易行、最普遍的一种检查手段,距今已有100多年历史,并且食道导联心电图、心电图负荷试验、遥测心电图等均由其推广应用而来;高灵敏度肌钙蛋白I(hs-cTnI)是心肌组织受损时能够在血液内检测到的敏感性、特异性最高的生物标志物,对于心血管疾病诊断、危险分层均有重要意义。
2025-08-15近年来心肌标志物已在AMI诊断中不断应用,其中脑钠肽(brainnatriureticpeptide,BNP)、肌钙蛋白Ⅰ(cardiactroponinI,cTnI)作为重要的心肌标记物,通过检测血清BNP、cTnI水平能够评估患者心室功能及心肌细胞受损状态,为AMI诊断及治疗提供指导[4]。
2025-08-12急性心肌梗死是心血管系统常见疾病,在老年人群中发病率较高。随着我国人口老龄化进程的加快,该疾病的患病率呈上升趋势[1]。该病临床表现为突发性胸部压榨性疼痛,具有起病急骤、病情危重、病死率高等特点,可导致患者心功能严重受损,威胁生命安全。因此,及时采取积极有效的治疗措施对降低病死率、改善患者预后至关重要。
2025-08-04人气:19289
人气:17590
人气:16628
人气:15806
人气:13842
我要评论
期刊名称:心脑血管病防治
期刊人气:1414
主管单位:浙江省卫生厅
主办单位:浙江省心脑血管病防治办公室,浙江省预防医学会,浙江医院
出版地方:浙江
专业分类:医学
国际刊号:1009-816X
国内刊号:33-1252/R
创刊时间:2001年
发行周期:双月刊
期刊开本:大16开
见刊时间:10-12个月
影响因子:0.000
影响因子:0.582
影响因子:1.464
影响因子:0.000
影响因子:0.623
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!