91学术服务平台

您好,欢迎来到91学术官网!业务合作:91xueshu@sina.com,站长邮箱:91xszz@sina.com

发布论文

论文咨询

基于GEO数据库筛选川崎病的差异表达基因及通路的研究

  2023-09-28    23  上传者:管理员

摘要:应用生物信息学方法分析与川崎病发病可能相关的基因及蛋白信号通路。方法 从综合基因表达数据库中下载川崎病基因表达数据集GSE18606和GSE68004。利用GEO2R工具对数据集进行预处理,筛选差异基因,将两者进行交集,得到差异表达基因(DEGs)。利用R软件富集分析DEGs的生物学功能和信号通路,利用STRING数据库和cytoscape软件构建并改进蛋白-蛋白相互作用(PPI)网络,在mirdip数据库中预测核心基因对应的靶miRNAs。结果 在GSE18606和GSE68004数据集中共筛选出269个DEGs;DEGs的生物学功能主要包括免疫反应、中性粒细胞活化、细胞因子产生的正向调控、免疫反应T细胞活化、分泌颗粒膜和葡萄糖结合免疫受体活性等;信号通路主要包括造血细胞系、白细胞内皮细胞迁移、Toll样受体信号通路、胰岛素信号通路和T细胞受体信号通路;PPI网络包含218个DEGs和674对互相作用关系,其中STAT3、FGR、IL7R、HOOK3、MAPK14、LILRB2、CD2、CSF3R、SOCS3、GZMA、H2AC20、GZMK、H2BC5、ITK共14个为网络中的核心基因,预计受445个miRNA调控。结论 本研究应用生物信息学方法对公共GEO数据库中川崎病差异表达基因及其生物学功能和相关信号通路进行了筛查及预测,为今后阐明KD的病因及发病机制提供了新的研究方向。

  • 关键词:
  • GEO数据库
  • microRNA
  • 川崎病
  • 差异表达基因
  • 生物信息学
  • 加入收藏

川崎病(Kawasaki disease,KD)是一种皮肤黏膜淋巴结综合征,最早由日本学者川崎富作报道,其好发于5岁以下儿童,主要临床表现为急性发热、皮疹、黏膜血管炎、肝脾淋巴结肿大等。KD被归类为儿童急性血管疾病,可导致儿童获得性心源性冠状动脉疾病,主要包括冠状动脉扩张、冠状动脉动脉瘤、冠状动脉狭窄、冠状动脉瘘形成等,症状严重时可出现心肌梗死、缺血性心肌病,甚至猝死,是目前发达和发展中国家儿童获得性心脏病最常见的病因[1]。关于KD的临床治疗主要为早期大剂量静脉注射丙种球蛋白联合阿司匹林。但目前关于KD的病因尚不清楚,存在感染、环境污染、过敏等多种假说[2],而早期诊断和早期干预是KD治疗的关键,但目前临床上仍缺乏KD诊断的“金标准”。此外,川崎病患儿依据初始静脉丙球输注治疗后的效果可临床分为丙球敏感型、丙球抵抗型;根据临床特征亦可分为完全型川崎病、不完全型川崎病。不同类型川崎病继发冠状动脉损害的风险不尽相同,故我们拟应用生物信息学方法来筛选不同类型川崎病患儿外周中差异表达的基因(differentially expressed genes,DEGs)、预测其生物学功能,为今后明确不同类型KD的相关生物标志物及其发病机制的研究提供新的方向。


1、资料与方法


1.1数据收集

登录GEO数据库并下载川崎病基因表达数据集GSE18606和GSE68004。GSE18606数据集含有20名急性KD患者(治疗前)和9名健康对照者的全血。通过agilent-014850全人类基因组芯片4x44k g4112f芯片检测,平台号为GPL6480。GSE68004数据集中采集了76名完全型川崎病儿童和37名健康儿童的外周全血样本,并用Illumina人HT-12 v4.0表达珠芯片芯片检测。平台号为GPL10558。

1.2筛选DEGs

使用GEO2R分析工具(https://www.ncbi.nlm.nih.gov/geo/geo2r/)分别对数据集GSE18606和GSE68004进行分析,以|logFC|>1和P<0.01为筛选标准进行DEGs的筛选,使用R软件包绘制火山地图,为降低假阳性率,采用维恩图绘制两组数据DEGs的交点。

1.3基因本体(gene ontology,GO)功能和京都基因与基因组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)通路富集分析

利用R语言软件计算正常儿童与川崎病儿童外周血样本中目标基因的表达差异,使用在线工具DAVID(https://david.ncifcrf.gov/)对筛选的目标基因进行GO功能和KEGG通路富集分析,GO功能分析包括生物学过程、细胞组成和分子功能,以P<0.05为差异有统计学意义,并绘制相应的直方图和气泡图。

1.4蛋白质-蛋白质相互作用网络的构建及子模块KEGG通路富集分析

通过在线分析工具STRING(https://string-db.org/)构建DEGs蛋白-蛋白相互作用网络(protein-protein interaction internet,PPI),以交互作用评分≥0.4为阈值条件,通过cytoscape软件对网络进行可视化,计算出每个节点对应的度值;同时使用mcode插件对网络中具有连接意义的子模块进行筛选,筛选条件为:连通性阈值=2,节点得分阈值=0.2,K core=2,最大深度=100,选取前3个模块,然后分析子模块中DEGs的KEGG路径。

1.5核心基因(Hub基因)筛选诊断效能的鉴定以及miRNA基因网络的建立

在模块基因中共享的基因和degree值前30的基因中进行筛选,将其定义为核心枢纽基因(Hub gene)。基于GSE68004数据集充足的样本量,通过ROC曲线判断核心枢纽基因对川崎病的诊断效能。在mirdip数据库中选择单向搜索功能预测Hub基因对应的目标miRNA,前1%置信度的miRNA被认为是潜在的靶向关系,通过cytoscape软件对miRNA基因网络进行可视化。


2、结果


2.1筛选KD相关的DEGs

利用GEO2R对两组数据集进行分析,得到上调和下调的DEGs,并绘制火山图(图1A、图1B),从数据集GSE18606和GSE68004中分别筛选了1010个和1103个DEG,将两个数据集的筛选结果进行交集制作维恩图(图1C),得到269个差异共表达的基因。

图1 KD中差异表达的DEG 

2.2 DEGs的功能和富集途径

GO分析结果(图2A)显示:269个差异共表达基因的分子功能变化主要集中在葡萄糖结合、免疫受体活性、碳水化合物结合、大环内酯结合、RAGE受体结合、阳离子、金属离子、质子逆向转运活性和溶液、阳离子逆向转运活性。细胞组成的变化主要集中在特异性颗粒、三级颗粒、秘密颗粒膜、秘密颗粒腔、细胞质泡囊腔、泡囊腔、特异颗粒腔、三级颗粒膜、富含ficolin-1的颗粒膜和三级颗粒腔。生物过程变化主要集中在中性粒细胞活化参与免疫应答、中性粒细胞脱颗粒、T细胞活化、细胞因子产生的正向调节、淋巴细胞分化、造血调节、免疫应答中白细胞分化和T细胞活化的调节。KEGG通路分析结果(图2B)显示:DEGs主要富集于造血细胞系、成骨细胞分化、白细胞内皮细胞迁移、谷胱甘肽代谢、肾素血管紧张素系统、Toll样受体信号通路、胰岛素信号通路、利什曼病和T细胞受体信号通路。

2.3 PPI网络和子模块KEGG通路富集分析

将上述269个DEGs导入字符串数据库构建PPI网络,共218个DEGs,674个交互关系(图3),互作关系详情以补充材料1的方式呈现。使用mcode插件对前3个具有连接意义的子模块进行筛选(图4)。KEGG通路富集分析(图5)显示该模块基因在利什曼病、果糖和甘露糖代谢、rig-i样受体信号通路、细胞因子-细胞因子受体相互作用、原发性免疫缺陷、脂肪细胞因子信号通路、幽门螺杆菌感染中的上皮细胞信号通路中均富集,此外还可作用于志贺氏菌病nod样受体信号通路,肌萎缩性脊髓侧索硬化症,半乳糖代谢,糖酵解/糖质新生,II型糖尿病,谷胱甘肽代谢,丙酮酸代谢,果糖和甘露糖代谢,半胱氨酸和蛋氨酸代谢,丙酸盐新陈代谢,磷酸戊糖途径,T细胞接收器信号C型肝炎,趋化因子信号通路,JAK-STAT信号通路,成骨分化和造血细胞谱系。

图2 DEGs的功能富集分析 

2.4 Hub基因筛选、诊断效能的鉴定以及miRNA基因网络的建立

使用插件cytoHubba在度值为前30的基因中筛选出Top14 Hub基因,此14个基因与模块基因重叠(图6),被定义为核心枢纽基因(STAT3、FGR、IL7R、HOOK3、MAPK14、LILRB2、CD2、CSF3R、SOCS3、GZMA、H2AC20、GZMK、H2BC5、ITK)。ROC曲线显示,上述Hub基因对川崎病的诊断效能较高(AUC值均>0.9)(图7)。对核心基因上游靶点的探索结果显示,Hub基因受445个miRNA调控,其中hsa-mir-337-3-p、hsa-mir-4687-3-p、hsamir-7160-5-p、hsa-mir-764、hsa-mir-6503-3-p、hsa-mir-3190-5-p、hsa-mir-4695-5-p、hsa-mir-527、hsa-mir-5197-3-p、hsa-mir-5590-5-p、hsa-mir-6875-5-p、hsa-mir-1304-5-p、hsa-mir-4768-3-p、hsa-mir-5187-3-p、hsa-mir-3690、hsa-mir-145-3-p、hsa-mir-1258、hsa-miR-185-5p和hsa-miR-4662a-3p可以同时调控多个Hub基因(图8)。


3、讨论


川崎病是一种病因不明的急性自限性发热性疾病。目前关于其病因和发病机制尚不清楚,有研究[3]认为其可由肺炎支原体、化脓性链球菌、疱疹病毒和轮状病毒等多种感染引起。同时遗传因素在KD的发病中也发挥着重要作用。一些研究[4]结果表明,KD的易感存在一定的遗传因素,包括:同卵双生儿发生KD的风险约为13%;父母有KD病史者,其兄弟姐妹及子女中KD的发生率亦有所增加。全基因组分析表明,多基因多态性与KD的发生发展密切相关。在家族连锁和基因组关联研究中,已证实不同基因和基因区域存在多个单核苷酸多态性(single nucleotide polymorphism,SNP),包括caspase-3、肌醇1,4,5-三磷酸激酶C、CD40、FCGR2A、FCGR2B以及细胞淋巴激酶[5,6]。许多与KD相关的SNPs在其他炎症性疾病中也被发现,如类风湿关节炎、溃疡性结肠炎、红斑狼疮和系统性硬化症。以上结果证实:炎症免疫反应在这些疾病的发生发展中发挥着重要的作用。

图3川崎病中DEGs的蛋白相互作用网络  

图4从PPI中选择最重要的模块:  

目前,临床上尚缺乏特异性的川崎病诊断标志物。本项研究选用川崎病患儿与正常健康儿童外周血标本行基因芯片全基因组对比研究,利用GEO2R工具对川崎病基因表达数据集GSE18606和GSE68004进行预处理,筛选差异基因进行交集,得到差异表达基因,再利用R软件富集分析其生物学功能和信号通路,利用STRING数据库和cytoscape软件构建、改进蛋白-蛋白相互作用网络,根据degree值和关键模块基因,最终筛选到共14个核心枢纽基因(STAT3、FGR、IL7R、HOOK3、MAPK14、LILRB2、CD2、CSF3R、SOCS3、GZMA、H2AC20、GZMK、H2BC5、ITK)。根据ROC曲线表明,核心基因对川崎病具有良好的诊断效能,可作为临床上川崎病的诊断标志物。此外,本研究通过mirdip数据库预测了核心基因的上游miRNAs,预计受445个miRNA调控,为下一步对上游miRNA调控核心基因的机制研究提供了思路。值得注意的是,可能存在很多相对保守的川崎病的调控基因或蛋白,因其表达稳定,变化幅度较少,难以被现有的实验技术与分析手段所发现,这是目前生物分析技术的盲点。对这类基因与蛋白的研究可能要依赖于更多新兴生物信息技术的发展与帮助,这可能是以后川崎病生物医学研究努力与发展的方向之一。此外,除了GSE18606和GSE68004数据集,GEO数据库中还有其他川崎病相关数据集,但这两个数据集的研究对象与本研究最吻合,具有一定的临床典型性。其他数据集则或者研究的目标人群不符合,或者研究的样本量不足,均不适宜作为研究数据集。故我们选择GSE18606和GSE68004这两个数据集。随后我们就目前国内外相关文献中检索到的与川崎病有关联报道,对核心基因的功能做简单阐述。

图5三个模块基因KEGG通路富集分析  

图6 Hub基因的鉴定  

STAT3(signal translator and activator of transcription3)是STATs家族的重要成员之一,羧基端转录激活区参与了转录复合体的形成,其最大转录活性受727位丝氨酸磷酸化水平调控。STAT3磷酸化(p-STAT3)被激活,可诱导细胞增殖、分化、生存与凋亡密切相关的关键基因的异常高表达[7]。既往本课题组研究[8]发现,miR-223-3p在川崎病患儿急性期外周血清标本中明显高表达,川崎病小鼠动物模型实验亦证实:mi R-223-3p可通过直接与IL-6ST 3'UTR的结合,继而下调p-STAT3和NF-κB p65的表达进而发挥保护性作用,进而提示STAT3信号通路在川崎病发病机制中发挥了重要作用。国内李海洲等[9]应用miR-155抑制序列的质粒脂质体复合物尾静脉注射干酪乳杆菌胞壁成分诱导的川崎病小鼠模型,发现抑制miR-155可改善川崎病引起的心肌损伤,可能是通过调控细胞因子信号抑制因子1/STAT3信号通路进而发挥心肌保护作用。

图7基于GSE68004数据集评估14个核心基因(STAT3、FGR、IL7R、HOOK3、MAPK14、LILRB2、CD2、CSF3R、SOCS3、GZMA、H2AC20、GZMK、H2BC5、ITK)对川崎病的诊断效能。   FGR原癌基因是类固醇受体共激活因子(steroidreceptor coactivator,SRC)家族成员之一,这是一个与EB病毒相关的基因,在EB病毒永生期早期,FGR的激活非常重要。其核苷酸序列表明,FGR的两个主要启动子中有一个是专门针对EB病毒感染的B淋巴细胞。来自台湾的一项旨在阐明SRC-1基因多态性与川崎病冠状动脉损害(coronary artery lesion,CAL)发病机制之间的关系研究[10]发现:有、无冠脉损害的KD患者中SRC-1的4个SNPs的基因型和等位基因频率分布差异有统计学意义,提示SRC-1的基因多态性可能是川崎病CAL的潜在原因,这也为我们下一步继续寻找FGR参与KD信号通路的调节机制研究提供了帮助。

白介素7受体(interleukin-7 receptor,IL-7R)由IL-7Ra和YC组成。YC在大多数造血细胞中表达,而IL-7Ra仅在淋巴细胞中表达[11]。IL-7和IL-7R介导的IL-7R/JAK信号通路是正常T细胞发育和稳态所必需。IL-7可通过激活JAK/STAT5信号通路[12]参与原发性免疫缺陷和细胞因子受体的相互作用、促进T细胞生存和细胞周期进展,IL-7R的异常表达可导致细胞功能的改变,最终导致疾病发生。有研究报道[13]其可参与调节T-急性淋巴细胞白血病细胞的代谢和细胞大小,在其生物活性中发挥着至关重要的作用。而一篇关于川崎病中IL-7R作用的免疫研究[14]指出:17名急性期未予治疗的川崎病患者中,有10名患者CD4+T细胞数量较低,而CD4+T细胞表面表达白介素7受体(IL-7R),提示体内存在着重复抗原刺激,进而认为KD患者体内可能有多个触发器,IL-7R可能通过刺激机体的先天性和获得性免疫应答反应,参与了KD的发病机制。

白细胞免疫球蛋白样受体亚家族B成员2(leukocyte immunoglobulin-like receptor for subfamily B member 2,LILRB2),又称ILT4,是lilrb家族的典型代表。生理条件下,LILRB2主要表达于单核细胞、树突状细胞(dendritic cell,DCs)和内皮细胞中,其可诱导人DCs的耐受表型,诱导抑制性T细胞的产生,抑制T细胞的活化和增殖。有报道[15]认为:LILRB2在川崎病患儿中异常表达,其虽然没有与KD直接相关,然而可能参与血管内皮功能、炎症反应或免疫调节,其可能是川崎病免疫治疗的潜在靶点。

粒细胞集落刺激因子受体(granulocyte colonystimu lating factor receptor,CSF3R)是一种蛋白质编码基因,它位于1号染色体的p34区域,由17272个碱基和19个外显子组成,该基因可调控粒细胞的形成、分化和信号转导。CSF3R基因最初被认为在粒细胞生长发育中起重要作用。Maxson等[16]首先在血液肿瘤中发现CSF3R的基因突变,可能影响造血细胞系,继而开启了其在血液肿瘤中的研究序幕。而关于其与川崎病的相关研究,国内陈植等[17]研究发现:G-CSF能够通过上调内皮祖细胞的数量和功能,从而达到阻止川崎病小鼠模型冠状动脉损伤的发生。国外有研究报道[18]认为:丙球无反应型患者治疗前血清中粒细胞集落刺激因子水平显著高于丙球有反应组患者,提示粒细胞集落刺激因子水平可能是预测KD患者对静脉丙球反应良好的生物标志物。而另一项研究英夫利昔单抗(infliximab,IFX)治疗难治性川崎病疗效的报道[19]指出:将29名对标准剂量的静脉注射免疫球蛋白(1 g/kg×2 d)产生耐药性的KD患儿纳入并接受IFX治疗,比较IFX给药前后血浆中细胞因子(IL-6、G-CSF、干扰素-γ等)的含量变化,结果发现:IFX治疗前相关细胞因子水平较健康对照组均显著升高,对IFX治疗有效组患儿服药后相关细胞因子迅速降至正常范围;而对IFX治疗无反应的患者其血浆中G-CSF含量一直保持高水平,提示其可能是对IFX反应不良的预测指标,在难治性川崎病发病机制中可能发挥关键作用。

图8 miRNA基因网络的建立  

下一步的临床研究中我们拟构建基因共表达网络来对于川崎病的发病机制进行进一步的研究,应用WGCNA算法进行基因模块划分,之后再进行每一模块的GO和KEGG分析,寻找和川崎病临床表现相关的模块和Hub基因。此外,鉴于生物信息分析只是预测,能否说明问题,我们还需要结合实验结果(如qPCR、Western blot)和临床指标观察来进行验证。

总之,本研究项目运用基因芯片技术筛选出了14种川崎病中有差异表达的关键基因(STAT3、FGR、IL7R、HOOK3、MAPK14、LILRB2、CD2、CSF3R、SOCS3、GZMA、H2AC20、GZMK、H2BC5、ITK),均可作为川崎病的诊断标志物。结合既往相关文献,对已报道与川崎病相关的核心基因(STAT3、FGR、IL-7R、LILRB2、CSF3R)做了简单的概述,而尚未报道的核心基因可能是具有潜在研究价值的致病基因。但本研究样本量有限,且缺乏临床实验验证,存在一定的局限性;且关于这些中心基因的功能与相关信号通路的进一步具体研究尚未开展。为了使这些潜在的基因诊断标志物能更有效地用于临床诊断与治疗,未来需要多中心和更大样本量的相关临床研究。


参考文献:

[9]李海洲,张琳,王瑾,等基于SOCS1/STAT 3信号通路探讨miR- 155对川崎病幼鼠心肌损伤的影响[J].中西医结合心脑血管病杂志, 2019, 19(12):2004- 2009.

[17]陈植.刘俊峰.杜忠东,等粒细胞集落刺激因子对川崎病小鼠模型内皮祖细胞及其期状动脉损伤的影响[J].中华儿科杂志, 2012, 50(10):788-792.


文章来源:贾思远,戴京京,阿布都色麦尔·热依木等.基于GEO数据库筛选川崎病的差异表达基因及通路的研究[J].中国优生与遗传杂志,2023,31(09):1752-1759.DOI:10.13404

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

中国优生与遗传杂志

期刊名称:中国优生与遗传杂志

期刊人气:2894

期刊详情

主管单位:中华人民共和国卫生部

主办单位:中国优生科学协会

出版地方:北京

专业分类:医学

国际刊号:1006-9534

国内刊号:11-3743/R

邮发代号:80-418

创刊时间:1981年

发行周期:月刊

期刊开本:大16开

见刊时间:10-12个月

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

400-069-1609

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定