91学术服务平台

您好,欢迎来到91学术官网!站长邮箱:91xszz@sina.com

发布论文

论文咨询

预测头颈部鳞状细胞癌患者预后应用长链非编码RNA的疗效分析

  2020-07-10    382  上传者:管理员

摘要:目的 研究长链非编码RNA(lncRNA)预测头颈部鳞状细胞癌(HNSC)患者预后的作用。方法下载癌症基因组图谱(TCGA)数据库中HNSC的lncRNA表达数据,使用edgeR包分析HNSC样本中差异表达的lncRNAs。使用COX回归分析筛选预测预后的关键lncRNAs,使用Kaplan-Meier法分析不同数据集中关键lncRNAs与预后的关系,最后对关键lncRNAs相关蛋白编码基因进行功能富集。结果 筛选出5个lncRNAs(RP11-865I6.2、RP11-417L19.2、RP11-567M16.1、RP11-44K6.2、FALEC)与预后显著相关。在不同数据集中,高风险患者预后明显差于低风险患者,而且5个lncRNAs独立于临床病理参数。功能富集主要集中在白细胞粘附、抗原处理和呈递、淋巴和T细胞分化激活。结论 5个lncRNAs可作为一个独立的预测HNSC患者生存预后的标志物。

  • 关键词:
  • 头颈肿瘤
  • 头颈部鳞状细胞癌
  • 标志物
  • 长链非编RNA
  • 预后
  • 加入收藏

头颈部鳞状细胞癌(HNSC)每年全球约新增75万病例,死亡约40万,严重威胁人类健康[1],这类肿瘤包括起源于口腔、口咽、下咽、喉、鼻咽、腭舌和扁桃体的癌症。这类患者的预后受多种因素的影响,预测其预后对临床工作十分重要。长链非编码RNA(lncRNA)在HNSC的发生发展过程中发挥重要作用,影响肿瘤的生存、迁移和侵袭,可能是潜在的预后标志物[2]。既往已有lncRNA预测喉癌预后的相关研究[3],本研究利用癌症基因组图谱(TCGA)数据库中HNSC表达数据预测患者5年生存率,筛选预测预后的关键lncRNA。


1、材料与方法


1.1HNSC患者信息

头颈部鳞状细胞癌(HNSC)患者RNA-seq数据和临床资料由TCGA网站下载。临床资料包括总体生存率(OS)、年龄、性别、肿瘤分级和AJCC分期。

1.2HNSC样本表达谱

HNSC患者HTSeq-counts数据与GENCODE数据库资料匹配添加注释信息。使用RP-KM对lncRNAs和mRNAs表达水平进行标准化。lncRNAs筛选标准:Ⅰ.转录位置不在蛋白编码区域;Ⅱ.在Gencode中存在注释信息;Ⅲ.至少在一半HNSC样本中表达;Ⅳ.平均RPKM>0.1。

1.3差异表达分析

使用edgeR包以log2|foldchange|>1和调整后P<0.001作为阈值计算差异表达lncRNAs。

1.4关键lncRNA筛选

在训练集中使用单因素COX分析计算差异表达lncRNAs与总体生存率(OS)之间的关系,然后使用多因素COX分析随机生存森林法筛选关键lncRNAs,风险评分(RS)等于每个lncRNA的Coeffcient系数乘以其表达量之和,大于中位值定义为高风险,反之为低风险,以P-value<0.05表示差异有统计学意义。

1.5生存分析

使用Kaplan-Meier曲线log-rank检验计算两组的生存差异,多因素COX分析和分层分析评估关键lncRNAs和临床特征的关系。使用受试者工作特征(ROC)曲线评估五年生存预测的敏感性和特异性。

1.6功能富集

使用Spearman相关性分析筛选lncRNA-mR-NA共表达的蛋白编码基因,相关系数>0.40,P<0.01表示显著相关。功能富集使用GO分析,通路富集使用KEGG分析,以P-value<0.001,Q-value<0.01作为阈值。所有分析均使用R(version3.6.2)软件。


2、结果


2.1关键lncRNAs

通过与临床信息匹配共筛选出475例样本,随机分为训练集(n=238)和测试集(n=237),共筛选出493个满足阈值的差异表达lncRNAs。在训练集共筛选出5个关键lncRNAs与样本预后明显相关(表1),其中1个(RP11-865I6.2)为正系数,表示其高表达与短生存期相关,4个(RP11-417L19.2、RP11-567M16.1、RP11-44K6.2、FALEC)为负系数,表示其高表达与长生存期相关。

表1HNSC训练集中5个lncRNAs与总体生存率的关系

2.2训练集中关键lncRNAs与总体生存率

训练集中Kaplan-Meier曲线显示高风险患者(n=119)预后显著差于低风险患者(n=119)(P<0.0001,图1A)。高风险患者3年生存率38.61%、5年生存率23.59%、8年生存率0%,低风险患者3年生存率79.80%、5年生存率63.78%、8年生存率39.25%。使用ROC曲线评估5个lncRNAs预测HNSC患者预后的作用,其ROC曲线下(AUC)面积为0.774(图1B)。单因素COX分析显示5个lncRNAs风险评分显著和患者预后相关(表2)。高风险患者死亡率显著高于低风险患者(图1C),热图显示RP11-865I6.2在高风险组上调,RP11-417L19.2、RP11-567M16.1、RP11-44K6.2和FALEC在高风险组下调(图1C)。

2.3测试集、整集中关键lncRNAs与总体生存率

测试集中高风险患者(n=132)OS明显差于低风险患者(n=105)(P=0.0042,图2A)。整集中高风险患者(n=251)生存期明显短于低风险患者(n=224)(P<0.0001,图2B)。测试集高风险患者3年生存率51.02%、5年生存率37.93%、8年生存率15.17%;低风险患者3年生存率61.19%、5年生存率52.35%、8年生存率52.35%。整集中高风险患者3年生存率45.11%、5年生存率31.61%、8年生存率11.08%;低风险患者3年生存率72.09%、5年生存率58.66%、8年生存率47.16%。测试集和整集AUC分别为0.651(图2C)和0.712(图2D)。

表2不同数据集COX分析结果

图1HNSC训练集中5个lncRNAs风险评分模型预测总体生存率

2.4关键lncRNAs的独立性分析

COX分析显示5个lncRNAs危险评分、年龄与预后相关(表2)。按中位年龄61岁将样本分为两组,结果显示在不同年龄分层中,高风险患者OS显著短于低风险患者(图3A-3C)。低风险中不同年龄组患者预后无差异(P=0.091,图3D)。

图2HNSC测试集与整集中5个lncRNAs风险评分模型预测总体生存率

图35个lncRNAs在不同年龄患者的分层分析

2.5关键lncRNAs的功能分析

共筛选出728个蛋白编码基因,GO分析显示5个关键lncRNAs相关蛋白编码基因在242个GO项中显著富集,其中BP219项,CC13项,MF10项,KEGG分析显示在33个通路中显著富集。功能富集主要集中在白细胞粘附、淋巴细胞分化、淋巴和T细胞激活(图4A),通路富集主要集中在抗原处理和呈递、T细胞分化、细胞粘附分子(图4B)。

图45个lncRNAs的功能富集分析


3、讨论


长链非编码RNA(lncRNA)调节肿瘤发生、迁移和侵袭。已有众多研究发现lncRNA通过下游基因靶向调节HNSC细胞增殖与入侵[4,5,6],许多研究表明lncRNA可以作为癌症预后的独立预测因子[7,8]。XiongD等[9]的研究发现LINC00958和HOXC13-AS可作为HNSC患者的诊断标志物。lncRNA是癌和其他头颈部肿瘤的重要生物标志物[10]。但是,lncRNA在预测HNSC患者预后中的作用尚不明确。

本研究中,我们利用TCGA数据库,在训练集中通过单因素和多因素COX分析构建了一个基于5-lncRNAs的风险模型,利用中位风险值将患者分为高风险组和低风险组。在测试集和全集中验证了5-lncRNAs模型,与低危患者相比,高危患者总体生存率低。将5-lncRNAs模型与临床信息相结合做分层分析,证实5-lncRNAs模型独立于临床因素,这增加了预后预测的可靠性。RP11-865I6.2上调,与患者预后呈负相关,RP11-417L19.2、RP11-567M16.1、RP11-44K6.2和FALEC下调,与患者预后呈正相关。我们的研究中,共筛选出5个lncRNAs作为预测HNSC患者预后的关键因子,据我们所知,之前没有关于这5个lncRNAs的报告,表明它们是在本研究中新发现的。LiJ等[11]研究发现了10个lncRNAs,XingL等[12]发现4个lncRNAs,ZhangZ等[13]发现3个lncRNAs,YangB等[14]发现8个lncRNAs,这些lncRNAs均与HNSC患者预后明显相关。这可能是分析过程中数据处理方法的差异,样本量的不同,样本来源数据库的不同以及不同lncRNA之间的差异导致患者处于不同的风险水平所导致。本研究利用一个稳健的随机生存森林分析来筛选与预后相关的关键lncRNA,确定了一个5-lncRNAs风险模型,而且没有和以上研究相重复的lncRNA。我们希望更多的类似研究揭示预测HNSC患者预后的关键因子,PanY等[15]研究发现RP11-865I6.2、RP11-366H4.1、HOTTIP、RP11-275N1.1可作为HNSC患者的预后预测基因,这些重复较多的基因可能为进一步研究HNSC的分子机制和生物标志物提供新的靶点和理论基础,而且,采用生物信息学工具对HNSC中lncRNA进行表达分析时必须使用不同的方法对结果进行验证。我们的研究提示这个5个lncRNAs独立于临床因素。事实上,包含基因信息、临床病理分期的变量相较于单纯的TNM分期变量能更加准确的估计喉癌总体生存率[3]。既往有研究发现在中国人中lncRNAWWTR1-AS1过表达与不良预后相关[16],我们的结果中不包括上述基因,可能是由于人种的差异导致其潜在的分子机制不同。富集分析显示与5个lncRNAs相关蛋白编码基因主要集中在细胞免疫及分子粘附方面。这与以前肿瘤免疫以及细胞粘附分子的相关研究结果相似[17,18]。

本研究存在一定的局限和不足。首先,本研究主要集中在数据挖掘和分析两个方面,这些都是基于统计学方法,研究结果没有通过进一步的实验验证,没有试验分析其潜在机制,此外,我们只分析验证了TCGA数据集中5个lncRNAs的预测能力,没有其他数据库lncRNA表达数据用于进一步验证。其次,由于不同的lncRNA检测方法可能导致不同的结果,因此必须对lncRNA的检测、量化和转录活性的测定过程进行标准化。最后,lncRNA通过复杂的调控网络调节肿瘤过程,涉及到不同种类的顺式和反式调控元件,在广泛的生物过程中发挥着重要的调控作用,需要进一步的综合分析5个lncRNA在HNSC中的作用。因此,我们建议未来的研究应增加多变量预测模型以提高HNSC患者预后预测的准确性。

本研究中,我们证明了lncRNAs在HNSC患者中的预测价值,提示5个lncRNAs有助于预测临床结果,并且是独立预测HNSC患者生存率的有效预后生物标志物。


向琳,徐晓晨,谭君武,杜波.长链非编码RNA预测头颈部鳞状细胞癌患者预后的研究[J].中国实验诊断学,2020,24(05):733-738.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

肿瘤预防与治疗

期刊名称:肿瘤预防与治疗

期刊人气:1253

期刊详情

主管单位:四川省卫生健康委员会

主办单位:四川省肿瘤医院

出版地方:四川

专业分类:医学

国际刊号:1674-0904

国内刊号:51-1703/R

邮发代号:62-142

创刊时间:1973年

发行周期:月刊

期刊开本:16开

见刊时间:10-12个月

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定