摘要:目的:基于基因表达数据库(GEO)筛选骨髓增生异常综合征(MDS)相关差异基因(DEG),通过分析DEG的生物学功能及相关信号通路,探讨MDS的核心基因及其发病机制。方法:从GEO数据库筛选包含有MDS患者和正常对照组的基因芯片数据集(GSE4619,GSE19429,GSE58831),借助GEO数据库的基因表达分析工具(GEO2R),以|logFC(foldchange)|≥1以及P<0.01为标准筛选数据库中的DEG。利用David在线数据库对DEG进行基因本体功能注释(GO);利用Metascape在线数据库对DEG进行京都基因与基因组百科全书(KEGG)富集分析。利用STRING数据库构建蛋白质互作用网络(PPI)并利用Cytoscape的CytoHubba和Mcode插件分析其关键基因簇及核心基因。利用R语言对筛选出的核心基因进行诊断试验分析并绘制ROC曲线。根据LEF1的表达量对GSE19429进行GSEA富集分析。结果:本研究共筛选出74个共同差异基因,其中上调14个,下调60个。GO分析结果显示,下调基因的BP主要富集在RNA聚合酶Ⅱ启动子转录及调控、细胞增殖的负调控以及免疫应答;CC主要富集在细胞核、转录因子复合物和黏着斑;MF主要富集在蛋白质结合、DNA结合以及β-连环蛋白结合;KEGG通路则主要富集在原发性免疫缺陷、Hippo信号通路、cAMP信号通路、癌症中的转录失调以及造血细胞系。上调基因的BP主要富集在Ⅰ型干扰素信号通路、病毒反应等,CC主要富集在细胞质,MF主要富集在RNA结合。通过STRING数据库及Cytoscape软件共筛选出10个核心基因以及3个重要的基因簇,进一步通过基因功能富集发现3个关键基因簇的功能均与免疫调控关系密切。ROC分析发现筛选出的核心基因对MDS具有较好的诊断意义。通过对核心基因进行GSEA分析发现LEF1可能通过调控炎症反应等影响造血干细胞的正常功能,进一步揭示了MDS的发病机制。结论:利用生物信息学方法能有效筛选出MDS的核心基因和关键信号通路,为MDS的诊治提供新的策略。
加入收藏
骨髓增生异常综合征(MDS)是一种起源于造血干细胞(HSC)的异质性髓系克隆性疾病,根据2016WHO分型可以将原发性MDS分为MDS伴单系病态造血、MDS伴多系病态造血、MDS伴环形铁粒幼红细胞、MDS伴原始细胞增多1型、MDS伴原始细胞增多2型、MDS伴单纯5q-型、MDS未分类型、儿童难治性血细胞减少症。MDS具有血细胞减少、形态发育不良、造血功能低下和高风险向急性髓系白血病(AML)转化等特点[1]。MDS在各个年龄均可发病,但以老年人较多见,发病率约为2.5/10万[2]。MDS发病机制错综复杂,大约1/3的MDS患者会转化为AML,严重影响MDS患者的生存率[3]。
目前,MDS的治疗主要包括生长因子、来那度胺、去甲基化药物和输血,然而,由于早期缺乏最佳的治疗方案,MDS仍然是一种生存率很低的疾病。异基因造血干细胞移植是大多数MDS患者唯一有效的治疗方法。近年来,基因芯片技术发展迅速,已成为探索和监测疾病基因改变的有效工具[4]。有研究表明,MDS与异常基因突变有关[5],因此,通过基因芯片技术和生物信息学方法系统分析寻找新的生物标志物对MDS的早期诊断、治疗和预后至关重要。本研究拟检索GEO(GeneExpressionOmnibus)数据库中MDS相关的数据集,通过生物信息学技术进行分析,寻找与MDS相关的生物标志物,为揭示MDS发生的分子机制提供理论依据。
1、材料与方法
1.1 资料
以“Myelodysplasticsyndrome为关键词”从GEO数据库中检索含有人源骨髓样本的芯片,选取基因芯片GSE4619、GSE19429、GSE58831。3个数据集均基于GPL96平台(AffymetrixHumanGenomeU133AArray),其中GSE4619数据集包含55例MDS患者样本,11例健康人样本,GSE19429数据集包含183例MDS患者样本,17例健康人样本,GSE58831数据集包含159例MDS患者样本,17例健康人样本。
1.2 数据处理及差异表达基因(DEG)的筛选
通过利用GEO数据库自带的在线分析工具GEO2R筛选MDS患者与正常对照之间的DEG,筛选标准为P<0.01,|logFC(foldchange)|≥1;采用R语言绘制DEG的火山图,以及74个共同差异基因的热图。
DEG的功能注释(GO)富集和京都基因与基因组百科全书(KEGG)通路的分析
利用DAVID在线数据库(https://david.ncifcrf.gov),以FDR<0.05,P<0.05为筛选条件对DEG进行GO富集分析。其中GO富集分析包括生物学进程(biologicalprocesses,BP)、细胞组分(cellularcomponent,CC)和分子功能(molecularfunction,MF)。利用Metascape在线数据库对差异基因进行KEGG富集分析。通过R语言对GO和KEGG结果实现可视化。
1.3 蛋白网络(protein-proteininteractionnetwork,PPI)构建与核心基因(hubgene)筛选
利用STRING10(http://www.string-db.org)数据库对筛选出来DEG的编码蛋白构建PPI网络。通过Cytoscape软件(www.cytoscape.org/)的Mcode插件筛选出3个功能模块,通过CytoHubba插件筛选出连接度(Degree)排名前10的hub基因。
应用受试者工作特性曲线(receiveroperatorcharacteristiccurve,ROC)评价核心靶点
利用GSE19429中的数据构建疾病-对照的模型验证集,评价hub基因与MDS的关联程度。利用R语言绘制ROC曲线并通过计算ROC曲线下面积(AUC)对筛选出的核心基因进行评价。
1.4 Hub基因的功能分析
以LEF1表达高低将数据集GSE19429中的MDS样本分为两组,通过GSEA(GeneSetEnrichmentAnalysis)软件进行基因富集分析,选用MSigDB数据库中的h.all.v7.0.symbols.gmt数据集作为功能基因集。以P<0.05、FDR<0.25为显著基因的筛选条件,筛选出LEF1突变时与MDS患者发病相关的基因功能富集。
2、结果
2.1 DEG的筛选
通过GEO2R在线分析工具以P<0.01、|logFC(foldchange)|≥1为筛选标准筛选出差异基因,其中GSE4619有131个差异基因,GSE19429有127个差异基因,GSE58831有352个差异基因,采用R语言绘制DEG的火山图(图1A-C)。利用韦恩图交集(图1D),最终获得74个共同差异基因,其中60个表达下调,14个表达上调(表1)。对差异基因进行分析,并利用R语言对74个共同差异基因绘制差异基因热图(图2)。
2.2 DEG的GO功能富集及KEGG通路分析
通过DAVID在线数据库和Metascape在线数据库对差异基因进行分析,发现下调基因的BP主要富集在RNA聚合酶Ⅱ启动子转录及调控、细胞增殖的负调控以及免疫应答;CC主要富集在细胞核、转录因子复合物和黏着斑;MF主要富集在蛋白质结合、DNA结合以及β-连环蛋白结合(表2,图3A);下调基因的KEGG则主要富集在原发性免疫缺陷、Hippo信号通路、cAMP信号通路、癌症中的转录失调以及造血细胞系中(表3,图3C)。上调基因的BP主要富集在Ⅰ型干扰素信号通路、病毒反应等;CC主要富集在细胞质;MF主要富集在RNA结合(图3B)。
2.3 PPI网络的构建、hub基因的筛选以及hub基因的诊断意义评价
将获得的DEG导入到STRING10数据库,获得PPI(图4A)。随后通过Cytoscape的Mcode插件获得3个比较重要的基因簇(图4B)。Cluster1基因簇主要与原发性免疫缺陷、B细胞受体信号通路以及FoxO信号通路关系密切。Cluster2基因簇主要与抑制细胞增殖关系密切。Cluster3基因簇主要与TGF-β信号通路关系密切。
通过利用Cytoscape的Cytohubba插件,根据基因之间的连接度筛选出排名前10的基因,分别是PAX5(14)、RAG1(12)、CD79B(11)、EBF1(10)、IGLL1(10)、VPREB1(10)、CXCR4(9)、RAG2(8)、LEF1(7)、POU2AF1(7)(图4C)。通过绘制ROC曲线并计算AUC面积发现,筛选出的核心基因对MDS具有较好的诊断意义(图5)。
2.4 核心基因分析
通过对KEGG结果以及筛选出的核心基因进行功能分析发现,正常的LEF1表达是维持造血干细胞正常功能的必要条件,LEF1低表达会导致骨髓的造血功能受损,这与MDS的发病机制关系密切。根据LEF1表达高低将数据集GSE19429中的MDS患者样本分为两组,通过GSEA软件进行基因富集分析,选用MSigDB数据库中的h.all.v7.0.symbols.gmt数据集作为功能基因集。以P<0.05、FDR<0.25为显著基因的筛选条件。结果发现,LEF1与TNF-α、IFN-α以及IFN-γ等炎症反应基因集关系密切(表4,图6),这进一步揭示了MDS发病的病理生理机制。
3、讨论
MDS是一种起源于造血干细胞的骨髓克隆性疾病,其特征是血细胞减少、形态发育不良以及造血功能低下[6]。MDS的发病率随年龄增长而增加,近年来,由于人口老龄化问题的逐步加剧,MDS患者的数量也逐年增加。MDS也称为白血病前期,其高风险向AML转化的特点导致患者死亡率增加[7]。MDS的确切病因目前尚不明确,其危险因素主要包括细胞遗传学异常、基因突变、细胞微环境以及免疫调控等[8,9]。本研究拟检索GEO数据库中MDS相关的数据集,通过生物信息学技术进行分析,寻找与MDS相关的生物标志物,为揭示MDS发生的分子机制提供理论依据。
近年来,基因芯片在疾病研究中得到了广泛的应用。本研究通过检索GEO数据库中MDS相关的数据集,通过生物信息学技术进行分析共鉴定出74个共同差异基因,其中60个表达下调,14个表达上调。利用DAVID在线软件进行GO和KEGG富集分析,探讨DEG的生物学功能。GO富集分析表明,所鉴定的DEG主要富集在免疫过程中。KEGG通路上差异基因富集在原发性免疫缺陷、Hippo信号通路、cAMP信号通路、癌症中的转录失调以及造血细胞系中。前期研究发现,MDS患者的免疫相关基因高表达,导致骨髓无效造血,而正常的造血功能受到抑制,揭示了免疫调控在MDS的发生发展中发挥重要作用[10]。本研究通过Cytoscape软件共筛选出3个基因簇,其功能与免疫调控关系密切,进一步验证了免疫调控在MDS中的重要作用。
利用Cytoscape的Cytohubba插件共筛选出10个核心基因,分别是PAX5(14)、RAG1(12)、CD79B(11)、EBF1(10)、IGLL1(10)、VPREB1(10)、CXCR4(9)、RAG2(8)、LEF1(7)、POU2AF1(7),其中PAX5的连接度最高。既往研究发现,PAX5属于一种B细胞特异性转录因子,与B细胞的定向分化与发育关系密切,且在B细胞肿瘤以及肺癌等肿瘤的发生发展中发挥重要作用[11]。RAG1/2是一种重组激活基因蛋白复合物,Gough等[12]研究发现,RAG1缺失会促进MDS小鼠向AML转化,表明RAG1可作为MDS诊断、治疗和预后的生物标志物。CXCR4与造血祖细胞的迁移和动员关系密切,CXCR4缺失会导致骨髓造血不足和骨髓生成减少。Chang等[13]学者研究发现,CXCR4蛋白低表达会导致MDS患者细胞凋亡增加,进一步揭示了CXCR4可能在MDS的诊断和治疗中发挥重要作用。Derecka等[14]学者研究发现,EBF1缺失会改变间充质干细胞的细胞组成、染色质结构和基因表达谱,包括黏附相关基因的表达减少。此外,EBF1缺失还会导致HSC的黏附受损,从而导致骨髓生成减少,可能与MDS的发生发展存在联系。Pellagatti等[15]研究发现,LEF1是一种中性粒细胞生成调节因子,可能在MDS造血祖细胞成熟缺陷中起作用。通过GSEA分析发现,LEF1失调与TNF-α、IFN-α以及IFN-γ等炎症反应相关的基因集关系密切,进一步揭示了LEF1参与MDS发生发展可能的病理生理机制。CD79B、IGLL1、VPREB1以及POU2AF1在MDS中尚无文献报道,他们可能与其他基因协同作用,共同参与了MDS的发生发展。
综上所述,本研究通过检索GEO数据库中MDS相关数据集,对MDS患者和健康人的数据集进行全面的生物信息学分析,确定可能与MDS进展和预后有关的DEG。通过分析预测了MDS可能的发病机制并筛选出可能参与MDS发生发展的核心基因,发现LEF1失调与TNF-α、IFN-α及IFN-γ等炎症反应相关的基因集关系密切,这可能为MDS治疗的分子靶标和诊断生物标志物,为MDS的基础研究与临床诊治提供了新的思路。然而,本研究还具有一定的局限性,本研究完全基于GEO数据库中的数据,筛选出的核心基因仍需后期进一步通过实验验证。
参考文献:
[10]贾燕,常春康.铁过载与免疫炎症可作为MDS疾病进展的危险因素[J].中国实验血液学杂志2020,28(2):686-689.
[11]任胤龙,侯俊娜,赵玉苗,等.肺癌组织中PAX2、PAX5的表达变化及意义[J].山东医药,2015,55(35):80-82.
文章来源:王艳,王颖韶,胡耐博,滕广帅,周圆,白洁.骨髓增生异常综合征核心基因及关键通路的生物信息学分析[J].中国实验血液学杂志,2022,30(03):804-812.
分享:
睡眠障碍与心血管疾病的发病机制及临床转归存在显著相关性[4],这一现象在ACS患者中较为突出,最高发病率可达66.66%[5]。睡眠时间不足和睡眠质量下降不仅会加剧患者临床症状,更可能成为心血管事件复发及死亡风险的潜在诱因[6]。基于此,探究心血管疾病患者睡眠障碍的影响因素对其预后具有重要意义。
2025-09-05根据临床表现和解剖位置的不同,主动脉夹层可分为StanfordA型和StanfordB型两种类型,其中StanfordB型主动脉夹层(TypeBaorticdissection,TBAD)指的是夹层发生在主动脉弓以下,未累及升主动脉的部分[2]。尽管TBAD相较于A型夹层在治疗上相对简单,但其临床预后仍受到多种因素的影响。
2025-09-05院外心脏骤停(OHCA)是一种紧急医疗状况,具有极高的致死率和致残率,当其发生后,迅速识别并在第一时间开展心肺复苏,对于挽救患者生命至关重要。2020年美国心脏协会(AHA)心肺复苏指南强调,气道通畅的心脏骤停患者进行单纯球囊面罩和气管插管建立稳定气道,其抢救成功率无统计学差异。
2025-09-01心房颤动(简称房颤)是心功能不全患者的伴随症状之一,据统计有40.0%左右的发生率[1]。房颤将随着病情的发展导致心脏内血流动力学改变,从而加剧心脏重构,增加不良心脑血管疾病发生率,甚至威胁生命,因此,探寻新的、可调控的血清学标志物为房颤的防治提供指导成为重中之重。
2025-08-28冠状动脉粥样硬化性心脏病是最常见的心血管疾病,主要治疗手段包括基础药物治疗、冠状动脉介入治疗和冠状动脉旁路移植术(CoronaryArteryBypassGrafting,CABG)[1],其中经皮冠状动脉介入治疗(PercutaneousCoronaryIntervention,PCI)历经三十余年的快速发展,已成为当今冠心病重要的治疗手段[2]。
2025-08-28静息心率(RestingHeartRate,RHR)是一种敏感、无创且廉价的心脏功能指标,近年来受到广泛关注。RHR是交感神经系统活动的标志,其升高通常反映交感神经激活。流行病学和临床研究表明,RHR升高与心血管疾病(CardiovascularDisease,CVD)、代谢综合征及全因死亡率的风险增加密切相关[1-3]。
2025-08-28心力衰竭是一种常见的难治性心血管疾病,病理性心肌肥厚是导致心力衰竭的主要原因。病理性心肌肥厚涉及许多信号通路,例如丝裂原活化蛋白激酶(MAPK)、降钙素-活化T细胞的核因子(NFAT)和丝氨酸/苏氨酸蛋白激酶(AKT)信号通路,MAPK被认为是调控心肌肥厚的重要信号通路。
2025-08-23糖尿病是以高糖为特征的代谢性疾病,中国2021年20~79岁人群中糖尿病患者约有1.4亿例,其中95%以上为2型糖尿病(T2DM)。T2DM是动脉粥样硬化性心血管疾病(ASCVD)发病的独立危险因素,ASCVD也是导致T2DM患者致残和死亡的重要原因,并发ASCVD的T2DM患者死亡风险较一般人群增加1.90~2.26倍。
2025-08-20在临床上,CSX通常表现为用力时或静息胸痛、冠状动脉血流储备减少、微血管痉挛等典型的劳力型心绞痛症状,运动负荷试验显示ST段压低,但冠状动脉造影正常,且无其他特殊心脏疾病(如变异性心绞痛)[3]。国外最新统计,在接受冠状动脉造影的病人中,有10%~20%被确诊为CSX,但药物治疗CSX的效果欠佳[4]。
2025-08-19多项研究证实,心肌应变指标能够早于传统的左心室射血分数改变而出现异常,且应变值的降低与主要心血管不良事件的发生风险呈独立相关[2-5]。超声心动图斑点追踪和心脏磁共振(cardiacmagneticreso⁃nance,CMR)特征追踪(featuretracking,FT)技术是心肌应变测量的常用方法,但前者易受图像质量及探头角度影响,后者检查耗时长、成本高,不适用于部分存在禁忌症的患者。
2025-08-19人气:17219
人气:15028
人气:12342
人气:11931
人气:11868
我要评论
期刊名称:心肺血管病杂志
期刊人气:1678
主管单位:北京市卫生健康委员会
主办单位:北京市心肺血管疾病研究所,首都医科大学附属北京安贞医院
出版地方:北京
专业分类:医学
国际刊号:1007-5062
国内刊号:11-3097/R
邮发代号:82-636
创刊时间:1982年
发行周期:月刊
期刊开本:16开
见刊时间:10-12个月
影响因子:0.000
影响因子:0.582
影响因子:1.464
影响因子:0.000
影响因子:0.623
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!