91学术服务平台

您好,欢迎来到91学术官网!站长邮箱:91xszz@sina.com

发布论文

论文咨询

生物信息学技术和机器学习算法筛选急性心肌梗死核心基因

  2024-03-12    72  上传者:管理员

摘要:目的 基于生物信息学技术和机器学习算法筛选急性心肌梗死(AMI)核心基因,并采用细胞实验进行验证。方法 本实验时间为2021—2022年。从美国国立生物技术信息中心(NCBI)的高通量基因表达(GEO)数据库下载与AMI相关的3个m RNA基因芯片数据集(GSE34198、GSE66360和GSE83500),其中GSE66360和GSE83500为测试集,GSE34198为验证集。运用R 4.2.0软件中的“limma包”筛选GSE66360和GSE83500中差异表达基因。使用LASSO回归方法缩小差异表达基因的范围,然后使用支持向量机-递归特征消除(SVM-RFE)方法在差异表达基因中寻找特征基因,取两种机器学习算法的交集,即为核心基因。比较测试集中AMI组和对照组核心基因表达水平,绘制ROC曲线以评估核心基因表达水平对测试集、验证集受试者发生AMI的预测价值。将衰老心肌细胞随机分为正常氧组和缺氧/复氧组,其中正常氧组心肌细胞常规培养;缺氧/复氧组心肌细胞缺氧3 h后复氧2 h,以制备AMI细胞模型。采用q PCR法检测心肌细胞IL1R2、NR4A2、TREM1 m RNA相对表达量。结果 从GSE66360和GSE83500中筛选出145个AMI差异表达基因。在差异表达基因中,通过LASSO回归分析筛选出10个特征基因,通过SVM-RFE方法筛选出10个特征基因,取交集得到9个核心基因,分别为NFIL3、IL1R2、NR4A2、IRAK3、VCAN、CCL20、TREM1、LYZ、ITLN1。在测试集中,AMI组仅IL1R2、NR4A2、TREM1表达水平高于对照组(P<0.05)。ROC曲线分析结果显示,IL1R2、NR4A2、TREM1表达水平预测测试集受试者发生AMI的AUC分别为0.648[95%CI(0.534~0.756)]、0.623[95%CI(0.511~0.728)]、0.622[95%CI(0.502~0.730)];IL1R2、NR4A2、TREM1表达水平预测验证集受试者发生AMI的AUC分别为0.834[95%CI(0.761~0.898)]、0.866[95%CI(0.802~0.923)]、0.808[95%CI(0.729~0.880)]。缺氧/复氧组心肌细胞IL1R2、NR4A2、TREM1 m RNA相对表达量高于正常氧组(P<0.05)。结论IL1R2、NR4A2、TREM1是AMI核心基因,三者有望成为AMI潜在的生物标志物。

  • 关键词:
  • 心肌梗死
  • 机器学习
  • 核心基因
  • 生物信息学
  • 缺血缺氧性损伤
  • 加入收藏

急性心肌梗死(acute myocardial infarction,AMI)指动脉内壁斑块导致流向心脏的血液减少甚至中断,进而使心肌细胞发生缺血缺氧性损伤[1]。但心肌细胞是永久性细胞,其损伤后一般不能再生[2],故早期筛查AMI高风险人群具有重要的现实意义。近年来生物信息学技术在疾病诊断和预测方面应用广泛,而基因代谢组学作为生物信息学技术,其主要探究基因与疾病的关系[3,4]。目前,基于基因代谢组学探究肝癌、胃癌等核心基因的文献较多[5,6],但应用该技术筛选AMI核心基因的报道较少。机器学习是基于数据构建的计算模型。本研究旨在通过生物信息学技术和机器学习算法筛选AMI核心基因并进行验证,现报道如下。


1、材料与方法


1.1实验时间

本实验时间为2021—2022年。

1.2采用生物信息学技术筛选差异表达基因

1.2.1数据来源

从美国国立生物技术信息中心(National Center for Biotechnology Information,NCBI)的高通量基因表达(Gene Expression Omnibus,GEO)数据库(https://www.ncbi.nlm.nih.gov/geo/)下载与AMI相关的3个m RNA基因芯片数据集(GSE34198、GSE66360和GSE83500),其中GSE66360[非AMI患者20例(对照组),AMI患者17例(AMI组)]和GSE83500[健康对照者46例(对照组),AMI患者49例(AMI组)]为测试集,GSE34198[健康对照者46例(对照组),AMI患者49例(AMI组)]为验证集。

1.2.2筛选差异表达基因

运用R 4.2.0软件中的“limma包”,以|log2FC|>1、P<0.05为标准,筛选GSE66360和GSE83500中差异表达基因。

1.2.3 GO功能富集分析、KEGG通路富集分析

应用差异表达基因数据软件对差异表达基因进行GO功能富集分析,分析其主要富集的生物过程(biological process,BP)、细胞成分(cellular component,CC)、分子功能(molecular function,MF);通过Metascape官网(https://metascape.org)对差异表达基因进行KEGG通路富集分析。

1.3采用机器学习算法筛选核心基因

使用LASSO回归方法缩小差异表达基因的范围,然后使用支持向量机-递归特征消除(support vector machine-recursive feature elimination,SVM-RFE)方法在差异表达基因中寻找特征基因,取两种机器学习算法的交集,即为核心基因。

1.4核心基因表达水平及预测能力

比较测试集中AMI组和对照组核心基因表达水平,绘制ROC曲线以评估核心基因表达水平对测试集、验证集受试者发生AMI的预测价值,AUC为0.5~1.0,其值越大提示核心基因表达水平对AMI的预测价值越高。

1.5细胞实验验证核心基因

1.5.1实验细胞

大鼠心肌细胞株H9C2购自武汉普诺赛生物科技有限公司。

1.5.2主要实验试剂与仪器

胎牛血清(G i b c o,美国),D M E M培养基(Gibco,美国),总RNA提取试剂盒(Axygen,美国),Prime Script™RT reagent Kit(Takara,日本),TB Green®Premix Ex Taq™Ⅱ(Takara,日本),IL1R2、NR4A2、TREM1引物[生工生物工程(上海)股份有限公司];微量台式离心机(5810R)(Eppendorf,德国),荧光定量PCR仪(Applied Biosystems)(德国耶拿分析仪器股份公司),厌氧培养袋及厌氧产气包(Anaero Pack-Anaero)(三菱公司,日本)。

1.5.3细胞培养

采用含10%胎牛血清的DMEM培养液培养心肌细胞,将其置于37℃、95%O2、5%CO2培养箱中培养,当细胞汇合度达80%左右时进行传代。

1.5.4构建衰老心肌细胞模型及分组

采用D-半乳糖8 mg/ml刺激第2代心肌细胞9 d以制备衰老心肌细胞。将衰老心肌细胞按5×106个的数量接种到25T培养瓶中,然后随机将其分为正常氧组和缺氧/复氧组,其中正常氧组心肌细胞常规培养;缺氧/复氧组心肌细胞缺氧3 h后复氧2 h,以制备AMI细胞模型。

1.5.5 q PCR法检测IL1R2、NR4A2、TREM1 m RNA相对表达量

在25T培养瓶中收集正常氧组和缺氧/复氧组心肌细胞,按照总RNA提取试剂盒说明书提取细胞总RNA,将RNA反转录成c DNA,采用2-ΔΔCt法计算IL1R2、NR4A2、TREM1 m RNA相对表达量。基因引物序列和产物长度见表1,扩增条件见表2。实验独立重复9次。

表1基因引物序列和产物长度  

表2基因引物扩增条件

1.6统计学方法

采用Graph Pad Prism 6.0统计学软件进行数据处理。计量资料以(±s)表示,两组间比较采用成组t检验。以P<0.05为差异有统计学意义。


2、结果


2.1差异表达基因筛选结果

从GSE66360和GSE83500中筛选出145个AMI差异表达基因,其中上调差异表达基因125个、下调差异表达基因20个,见图1。

图1差异表达基因的火山图  

注:红色圆点为上调差异表达基因,绿色圆点为下调差异表达基因,黑色圆点为非差异表达基因。

2.2 GO功能富集分析结果

GO功能富集分析结果显示,差异表达基因主要涉及的BP为细菌的防御反应、中性粒细胞趋化性、粒细胞趋化性、中性粒细胞迁移、粒细胞迁移、骨髓白细胞迁移、白细胞趋化性、细胞对白介素1的反应、白介素1介导的信号通路;主要涉及的CC为三级颗粒、特殊颗粒、分泌颗粒管腔、细胞质小泡腔、富含纤维胶凝蛋白1的颗粒膜、特殊颗粒管腔、三级颗粒膜、液泡管腔;主要涉及的MF为碳水化合物的结合物、免疫受体活性、晚期糖基化终末产物受体结合物、Ig G结合物、病毒颗粒结合物、细胞核糖皮质激素受体结合物、肽聚糖溶血活性、核视黄醇X受体结合物、低聚糖结合物、调理素结合物。

2.3 KEGG通路富集分析结果

KEGG通路富集分析结果显示,差异表达基因主要涉及的信号通路为天然免疫反应应答、吞噬细胞杀伤的正性调节的信号通路。

2.4核心基因

在差异表达基因中,通过LASSO回归分析筛选出10个特征基因,见图2;通过SVM-RFE方法筛选出10个特征基因,见图3;取交集得到9个核心基因,分别为NFIL3、IL1R2、NR4A2、IRAK3、VCAN、CCL20、TREM1、LYZ、ITLN1,见图4。

图2差异表达基因的LASSO回归分析结果 

图3差异表达基因的SVM-RFE方法分析结果  

图4差异表达基因的韦恩图  

2.5 AMI核心基因表达水平及其预测价值

在测试集中,AMI组仅IL1R2、NR4A2、TREM1表达水平高于对照组,差异有统计学意义(P<0.05),见图5。ROC曲线分析结果显示,IL1R2、NR4A2、T R E M 1表达水平预测测试集受试者发生A M I的AUC分别为0.648[95%CI (0.534~0.756)]、0.623[95%CI(0.511~0.728)]、0.622[95%CI(0.502~0.730)],见图6;IL1R2、NR4A2、T R E M 1表达水平预测验证集受试者发生A M I的AUC分别为0.834[95%CI (0.761~0.898)]、0.866[95%CI(0.802~0.923)]、0.808[95%CI(0.729~0.880)],见图7。

2.6 q RT-PCR法验证核心基因m RNA相对表达量

缺氧/复氧组心肌细胞IL1R2、NR4A2、TREM1m RNA相对表达量高于正常氧组,差异有统计学意义(P<0.05),见表3。

表3正常氧组与缺氧/复氧组心肌细胞IL1R2、NR4A2、TREM1m RNA相对表达量比较(±s,n=9)  


3、讨论


AMI发病迅速且具有较高的死亡率[7,8]。目前,冠状动脉造影是诊断AMI的“金标准”,但其属于有创检查,故寻找AMI非创伤性诊断方法具有临床价值。本研究通过生物信息学技术和机器学习算法筛选出9个AMI核心基因,且在测试集中,AMI组仅IL1R2、NR4A2、TREM1表达水平高于对照组;ROC曲线分析结果显示,IL1R2、NR4A2、TREM1表达水平预测测试集受试者发生AMI的AUC分别为0.648、0.623、0.622,三者预测验证集受试者发生AMI的AUC分别为0.834、0.866、0.808;且缺氧/复氧组心肌细胞IL1R2、NR4A2、TREM1 m RNA相对表达量高于正常氧组,提示IL1R2、NR4A2、TREM1是AMI核心基因。

R O N G等[9]研究表明,I L 1 R 2基因多态性(rs11674595、rs4851527、rs2072472和rs3218977)可能与中国汉族人群骨质疏松症的发病有关,但其在AMI中的作用有待深入挖掘。NR4A2属于核受体4A亚家族,其编码类固醇甲状腺激素类维生素A受体,是核受体转录因子,而核受体转录因子在哺乳动物神经元发育、炎症、记忆形成等方面具有调节作用。研究表明,NR4A2基因突变与癫痫发作、神经发育异常和机体发育异常有关[10,11,12,13]。KARKI等[14]研究表明,NR4A2在胶质母细胞瘤中是促癌基因,且其在心血管应激反应中具有重要作用。ASHRAF等[15]研究表明,在成年哺乳动物心脏,特别是在心肌细胞中,在β-肾上腺素能刺激下NR4A2表达明显上调,其特异性过表达导致终末分化的心肌细胞重新进入细胞周期和DNA复制增加,但不导致心肌细胞分裂。TREM1是髓样细胞触发性受体家族成员,属于免疫球蛋白超家族受体,其主要功能是识别外源性抗原和毒性物质,从而调节炎症反应[16]。LIU等[17]研究表明,TREM1放大了脑源性和肠源性免疫原性成分的促炎反应,在TREM1上表达的触发受体可在多种心血管疾病中驱动炎症反应。VANDESTIENNE等[18]研究表明,TREM1可参与腹主动脉瘤的病理生理过程。KIMMOUN等[19]研究表明,TREM1与心源性休克患者90 d死亡率和各种器官损伤有关,但其在AMI中的具体分子机制尚不清楚。

图5测试集中对照组与AMI组IL1R2、NR4A2、TREM1表达水平比较的箱式图  

图6 IL1R2、NR4A2、TREM1表达水平预测测试集受试者发生AMI的ROC曲线 

图7 IL1R2、NR4A2、TREM1表达水平预测验证集受试者发生AMI的ROC曲线  


4、结论


综上所述,IL1R2、NR4A2、TREM1是AMI核心基因,三者有望成为AMI潜在的生物标志物。但本研究仍存在一定局限性:(1)无法阐明IL1R、NR4A2、TREM1导致AMI的具体机制;(2)无法明确IL1R、NR4A2、TREM1是否与其他组学有关,如代谢组学、蛋白组学等。

作者贡献:李淑娟进行文章的构思与设计,负责撰写、修订论文;柯妍进行研究的实施与可行性分析;刘旭东、贺茜、徐遥琴进行数据收集、整理、分析;田宇佳、卢冠军、马娟、朱澈进行结果分析与解释;汪乐新负责文章的质量控制及审校,并对文章整体负责、监督管理。


基金资助:国家自然科学基金资助项目(82060139);宁夏自然科学基金一般项目(2023AAC03679);


文章来源:李淑娟,柯妍,刘旭东等.基于生物信息学技术和机器学习算法筛选急性心肌梗死核心基因[J].实用心脑肺血管病杂志,2024,32(03):33-38.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

心脑血管病防治

期刊名称:心脑血管病防治

期刊人气:1414

期刊详情

主管单位:浙江省卫生厅

主办单位:浙江省心脑血管病防治办公室,浙江省预防医学会,浙江医院

出版地方:浙江

专业分类:医学

国际刊号:1009-816X

国内刊号:33-1252/R

创刊时间:2001年

发行周期:双月刊

期刊开本:大16开

见刊时间:10-12个月

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定