91学术服务平台

您好,欢迎来到91学术官网!站长邮箱:

发布论文

论文咨询

骨髓增生异常综合征核心基因及关键通路的生物信息学分析

  2022-06-02    472  上传者:管理员

摘要:目的:基于基因表达数据库(GEO)筛选骨髓增生异常综合征(MDS)相关差异基因(DEG),通过分析DEG的生物学功能及相关信号通路,探讨MDS的核心基因及其发病机制。方法:从GEO数据库筛选包含有MDS患者和正常对照组的基因芯片数据集(GSE4619,GSE19429,GSE58831),借助GEO数据库的基因表达分析工具(GEO2R),以|logFC(foldchange)|≥1以及P<0.01为标准筛选数据库中的DEG。利用David在线数据库对DEG进行基因本体功能注释(GO);利用Metascape在线数据库对DEG进行京都基因与基因组百科全书(KEGG)富集分析。利用STRING数据库构建蛋白质互作用网络(PPI)并利用Cytoscape的CytoHubba和Mcode插件分析其关键基因簇及核心基因。利用R语言对筛选出的核心基因进行诊断试验分析并绘制ROC曲线。根据LEF1的表达量对GSE19429进行GSEA富集分析。结果:本研究共筛选出74个共同差异基因,其中上调14个,下调60个。GO分析结果显示,下调基因的BP主要富集在RNA聚合酶Ⅱ启动子转录及调控、细胞增殖的负调控以及免疫应答;CC主要富集在细胞核、转录因子复合物和黏着斑;MF主要富集在蛋白质结合、DNA结合以及β-连环蛋白结合;KEGG通路则主要富集在原发性免疫缺陷、Hippo信号通路、cAMP信号通路、癌症中的转录失调以及造血细胞系。上调基因的BP主要富集在Ⅰ型干扰素信号通路、病毒反应等,CC主要富集在细胞质,MF主要富集在RNA结合。通过STRING数据库及Cytoscape软件共筛选出10个核心基因以及3个重要的基因簇,进一步通过基因功能富集发现3个关键基因簇的功能均与免疫调控关系密切。ROC分析发现筛选出的核心基因对MDS具有较好的诊断意义。通过对核心基因进行GSEA分析发现LEF1可能通过调控炎症反应等影响造血干细胞的正常功能,进一步揭示了MDS的发病机制。结论:利用生物信息学方法能有效筛选出MDS的核心基因和关键信号通路,为MDS的诊治提供新的策略。

  • 关键词:
  • LEF1基因
  • 发病机制
  • 差异表达基因
  • 生物信息学
  • 骨髓增生异常综合征
  • 加入收藏

骨髓增生异常综合征(MDS)是一种起源于造血干细胞(HSC)的异质性髓系克隆性疾病,根据2016WHO分型可以将原发性MDS分为MDS伴单系病态造血、MDS伴多系病态造血、MDS伴环形铁粒幼红细胞、MDS伴原始细胞增多1型、MDS伴原始细胞增多2型、MDS伴单纯5q-型、MDS未分类型、儿童难治性血细胞减少症。MDS具有血细胞减少、形态发育不良、造血功能低下和高风险向急性髓系白血病(AML)转化等特点[1]。MDS在各个年龄均可发病,但以老年人较多见,发病率约为2.5/10万[2]。MDS发病机制错综复杂,大约1/3的MDS患者会转化为AML,严重影响MDS患者的生存率[3]。

目前,MDS的治疗主要包括生长因子、来那度胺、去甲基化药物和输血,然而,由于早期缺乏最佳的治疗方案,MDS仍然是一种生存率很低的疾病。异基因造血干细胞移植是大多数MDS患者唯一有效的治疗方法。近年来,基因芯片技术发展迅速,已成为探索和监测疾病基因改变的有效工具[4]。有研究表明,MDS与异常基因突变有关[5],因此,通过基因芯片技术和生物信息学方法系统分析寻找新的生物标志物对MDS的早期诊断、治疗和预后至关重要。本研究拟检索GEO(GeneExpressionOmnibus)数据库中MDS相关的数据集,通过生物信息学技术进行分析,寻找与MDS相关的生物标志物,为揭示MDS发生的分子机制提供理论依据。


1、材料与方法


1.1 资料

以“Myelodysplasticsyndrome为关键词”从GEO数据库中检索含有人源骨髓样本的芯片,选取基因芯片GSE4619、GSE19429、GSE58831。3个数据集均基于GPL96平台(AffymetrixHumanGenomeU133AArray),其中GSE4619数据集包含55例MDS患者样本,11例健康人样本,GSE19429数据集包含183例MDS患者样本,17例健康人样本,GSE58831数据集包含159例MDS患者样本,17例健康人样本。

1.2 数据处理及差异表达基因(DEG)的筛选

通过利用GEO数据库自带的在线分析工具GEO2R筛选MDS患者与正常对照之间的DEG,筛选标准为P<0.01,|logFC(foldchange)|≥1;采用R语言绘制DEG的火山图,以及74个共同差异基因的热图。

DEG的功能注释(GO)富集和京都基因与基因组百科全书(KEGG)通路的分析

利用DAVID在线数据库(https://david.ncifcrf.gov),以FDR<0.05,P<0.05为筛选条件对DEG进行GO富集分析。其中GO富集分析包括生物学进程(biologicalprocesses,BP)、细胞组分(cellularcomponent,CC)和分子功能(molecularfunction,MF)。利用Metascape在线数据库对差异基因进行KEGG富集分析。通过R语言对GO和KEGG结果实现可视化。

1.3 蛋白网络(protein-proteininteractionnetwork,PPI)构建与核心基因(hubgene)筛选

利用STRING10(http://www.string-db.org)数据库对筛选出来DEG的编码蛋白构建PPI网络。通过Cytoscape软件(www.cytoscape.org/)的Mcode插件筛选出3个功能模块,通过CytoHubba插件筛选出连接度(Degree)排名前10的hub基因。

应用受试者工作特性曲线(receiveroperatorcharacteristiccurve,ROC)评价核心靶点

利用GSE19429中的数据构建疾病-对照的模型验证集,评价hub基因与MDS的关联程度。利用R语言绘制ROC曲线并通过计算ROC曲线下面积(AUC)对筛选出的核心基因进行评价。

1.4 Hub基因的功能分析

以LEF1表达高低将数据集GSE19429中的MDS样本分为两组,通过GSEA(GeneSetEnrichmentAnalysis)软件进行基因富集分析,选用MSigDB数据库中的h.all.v7.0.symbols.gmt数据集作为功能基因集。以P<0.05、FDR<0.25为显著基因的筛选条件,筛选出LEF1突变时与MDS患者发病相关的基因功能富集。


2、结果


2.1 DEG的筛选

通过GEO2R在线分析工具以P<0.01、|logFC(foldchange)|≥1为筛选标准筛选出差异基因,其中GSE4619有131个差异基因,GSE19429有127个差异基因,GSE58831有352个差异基因,采用R语言绘制DEG的火山图(图1A-C)。利用韦恩图交集(图1D),最终获得74个共同差异基因,其中60个表达下调,14个表达上调(表1)。对差异基因进行分析,并利用R语言对74个共同差异基因绘制差异基因热图(图2)。

2.2 DEG的GO功能富集及KEGG通路分析

通过DAVID在线数据库和Metascape在线数据库对差异基因进行分析,发现下调基因的BP主要富集在RNA聚合酶Ⅱ启动子转录及调控、细胞增殖的负调控以及免疫应答;CC主要富集在细胞核、转录因子复合物和黏着斑;MF主要富集在蛋白质结合、DNA结合以及β-连环蛋白结合(表2,图3A);下调基因的KEGG则主要富集在原发性免疫缺陷、Hippo信号通路、cAMP信号通路、癌症中的转录失调以及造血细胞系中(表3,图3C)。上调基因的BP主要富集在Ⅰ型干扰素信号通路、病毒反应等;CC主要富集在细胞质;MF主要富集在RNA结合(图3B)。

2.3 PPI网络的构建、hub基因的筛选以及hub基因的诊断意义评价

将获得的DEG导入到STRING10数据库,获得PPI(图4A)。随后通过Cytoscape的Mcode插件获得3个比较重要的基因簇(图4B)。Cluster1基因簇主要与原发性免疫缺陷、B细胞受体信号通路以及FoxO信号通路关系密切。Cluster2基因簇主要与抑制细胞增殖关系密切。Cluster3基因簇主要与TGF-β信号通路关系密切。

通过利用Cytoscape的Cytohubba插件,根据基因之间的连接度筛选出排名前10的基因,分别是PAX5(14)、RAG1(12)、CD79B(11)、EBF1(10)、IGLL1(10)、VPREB1(10)、CXCR4(9)、RAG2(8)、LEF1(7)、POU2AF1(7)(图4C)。通过绘制ROC曲线并计算AUC面积发现,筛选出的核心基因对MDS具有较好的诊断意义(图5)。

2.4 核心基因分析

通过对KEGG结果以及筛选出的核心基因进行功能分析发现,正常的LEF1表达是维持造血干细胞正常功能的必要条件,LEF1低表达会导致骨髓的造血功能受损,这与MDS的发病机制关系密切。根据LEF1表达高低将数据集GSE19429中的MDS患者样本分为两组,通过GSEA软件进行基因富集分析,选用MSigDB数据库中的h.all.v7.0.symbols.gmt数据集作为功能基因集。以P<0.05、FDR<0.25为显著基因的筛选条件。结果发现,LEF1与TNF-α、IFN-α以及IFN-γ等炎症反应基因集关系密切(表4,图6),这进一步揭示了MDS发病的病理生理机制。


3、讨论


MDS是一种起源于造血干细胞的骨髓克隆性疾病,其特征是血细胞减少、形态发育不良以及造血功能低下[6]。MDS的发病率随年龄增长而增加,近年来,由于人口老龄化问题的逐步加剧,MDS患者的数量也逐年增加。MDS也称为白血病前期,其高风险向AML转化的特点导致患者死亡率增加[7]。MDS的确切病因目前尚不明确,其危险因素主要包括细胞遗传学异常、基因突变、细胞微环境以及免疫调控等[8,9]。本研究拟检索GEO数据库中MDS相关的数据集,通过生物信息学技术进行分析,寻找与MDS相关的生物标志物,为揭示MDS发生的分子机制提供理论依据。

近年来,基因芯片在疾病研究中得到了广泛的应用。本研究通过检索GEO数据库中MDS相关的数据集,通过生物信息学技术进行分析共鉴定出74个共同差异基因,其中60个表达下调,14个表达上调。利用DAVID在线软件进行GO和KEGG富集分析,探讨DEG的生物学功能。GO富集分析表明,所鉴定的DEG主要富集在免疫过程中。KEGG通路上差异基因富集在原发性免疫缺陷、Hippo信号通路、cAMP信号通路、癌症中的转录失调以及造血细胞系中。前期研究发现,MDS患者的免疫相关基因高表达,导致骨髓无效造血,而正常的造血功能受到抑制,揭示了免疫调控在MDS的发生发展中发挥重要作用[10]。本研究通过Cytoscape软件共筛选出3个基因簇,其功能与免疫调控关系密切,进一步验证了免疫调控在MDS中的重要作用。

利用Cytoscape的Cytohubba插件共筛选出10个核心基因,分别是PAX5(14)、RAG1(12)、CD79B(11)、EBF1(10)、IGLL1(10)、VPREB1(10)、CXCR4(9)、RAG2(8)、LEF1(7)、POU2AF1(7),其中PAX5的连接度最高。既往研究发现,PAX5属于一种B细胞特异性转录因子,与B细胞的定向分化与发育关系密切,且在B细胞肿瘤以及肺癌等肿瘤的发生发展中发挥重要作用[11]。RAG1/2是一种重组激活基因蛋白复合物,Gough等[12]研究发现,RAG1缺失会促进MDS小鼠向AML转化,表明RAG1可作为MDS诊断、治疗和预后的生物标志物。CXCR4与造血祖细胞的迁移和动员关系密切,CXCR4缺失会导致骨髓造血不足和骨髓生成减少。Chang等[13]学者研究发现,CXCR4蛋白低表达会导致MDS患者细胞凋亡增加,进一步揭示了CXCR4可能在MDS的诊断和治疗中发挥重要作用。Derecka等[14]学者研究发现,EBF1缺失会改变间充质干细胞的细胞组成、染色质结构和基因表达谱,包括黏附相关基因的表达减少。此外,EBF1缺失还会导致HSC的黏附受损,从而导致骨髓生成减少,可能与MDS的发生发展存在联系。Pellagatti等[15]研究发现,LEF1是一种中性粒细胞生成调节因子,可能在MDS造血祖细胞成熟缺陷中起作用。通过GSEA分析发现,LEF1失调与TNF-α、IFN-α以及IFN-γ等炎症反应相关的基因集关系密切,进一步揭示了LEF1参与MDS发生发展可能的病理生理机制。CD79B、IGLL1、VPREB1以及POU2AF1在MDS中尚无文献报道,他们可能与其他基因协同作用,共同参与了MDS的发生发展。

综上所述,本研究通过检索GEO数据库中MDS相关数据集,对MDS患者和健康人的数据集进行全面的生物信息学分析,确定可能与MDS进展和预后有关的DEG。通过分析预测了MDS可能的发病机制并筛选出可能参与MDS发生发展的核心基因,发现LEF1失调与TNF-α、IFN-α及IFN-γ等炎症反应相关的基因集关系密切,这可能为MDS治疗的分子靶标和诊断生物标志物,为MDS的基础研究与临床诊治提供了新的思路。然而,本研究还具有一定的局限性,本研究完全基于GEO数据库中的数据,筛选出的核心基因仍需后期进一步通过实验验证。


参考文献:

[10]贾燕,常春康.铁过载与免疫炎症可作为MDS疾病进展的危险因素[J].中国实验血液学杂志2020,28(2):686-689.

[11]任胤龙,侯俊娜,赵玉苗,等.肺癌组织中PAX2、PAX5的表达变化及意义[J].山东医药,2015,55(35):80-82.


文章来源:王艳,王颖韶,胡耐博,滕广帅,周圆,白洁.骨髓增生异常综合征核心基因及关键通路的生物信息学分析[J].中国实验血液学杂志,2022,30(03):804-812.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

心肺血管病杂志

期刊名称:心肺血管病杂志

期刊人气:1678

期刊详情

主管单位:北京市卫生健康委员会

主办单位:北京市心肺血管疾病研究所,首都医科大学附属北京安贞医院

出版地方:北京

专业分类:医学

国际刊号:1007-5062

国内刊号:11-3097/R

邮发代号:82-636

创刊时间:1982年

发行周期:月刊

期刊开本:16开

见刊时间:10-12个月

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定