摘要:目的 探讨肝癌HBVDNA整合特征。方法 结合既往研究中肝癌患者肝癌组织和癌旁组织测序结果,总结其HBVDNA整合位点,通过生物信息学方法分析肝癌组织、癌旁组织中HBVDNA整合位点在染色体水平、重复序列水平、基因水平的分布。利用Bedtools软件计算整合位点与转录活性位点的距离,以探讨整合与转录活性的关系,并比较该特征在肝癌组织、癌旁组织及热点基因组、非热点基因组中的差异。结果 肝癌组织、癌旁组织中均有HBVDNA整合,其整合位点在染色体水平、重复序列水平和基因水平分布上均存在优势整合。肝癌组织和癌旁组织中分别有8.5%和9.0%的HBVDNA整合位点位于转录活性区域,而随机序列中仅有3.4%。依据泊松分布,在肝癌组织HBVDNA整合基因中鉴定出热点基因。肝癌组织中,热点基因组相较于非热点基因组,更多的HBVDNA整合于高转录活性区域(16.5%vs3.0%,P<0.001)。结论 HBVDNA在肝癌组织、癌旁组织中的整合特征不完全相同,但是在肝癌组织、癌旁组织中HBVDNA均倾向于整合至高转录活性区域。
加入收藏
肝细胞癌是最常见的肝癌类型,占肝癌的90%。它不仅是全球第五大最常见的癌症,也是第二大最常见的癌症死亡原因。HBV感染是中国、东南亚、撒哈拉以南非洲肝癌发生的主要危险因素[1],其具体发病机制有待深入研究。
HBV是一种双链部分环状结构的DNA病毒,大小约为3.2kb。早在20世纪80年代,已经发现了HBVDNA可以整合至宿主基因组中。近30年来,许多研究使用了不完全相同的方法聚焦于HBVDNA整合位点的捕获,描述了大量的可变的整合模式。因此,汇总这些数据有利于更全面描述HBVDNA整合概况及对肝癌组织、癌旁组织的HBVDNA整合模式进行比较,有助于了解HBV的致癌机制。在整合机制的研究上,对于HBV而言,在一项体外研究发现,HBV复制周期中环化失败而形成的双链线性HBVDNA(double-strandedlinearDNA,dslDNA)是人体内整合的HBVDNA的主要前体[2,3,4];而对于宿主基因组,HBVDNA整合的位点选择机制目前仍不清楚。
因而,为了探讨肝癌患者肝癌组织和癌旁组织中HBVDNA的整合模式以及探讨这些整合位点是否具有偏向性,本研究拟通过生物信息学方法对数据进行汇总过滤分析,根据所探测到的HBVDNA整合位点,观察其在染色体、基因重复序列、基因上的分布特征,并计算其与转录活性位点的距离,进而分析HBVDNA整合与转录活性的关系,以期探讨肝癌组织和癌旁组织中HBVDNA整合的分布及人染色体上易发生整合的部位,进而了解HBV介导肝癌发生的作用机制。
资料与方法
一、数据的获得与预处理
整理2010~2020年已发表的探究肝癌样本中HBVDNA整合位置的文献,将其纳入样本数及选用测序方法进行归纳。结合其样本量及测序方式,为了降低建库方法、测序深度对分析结果的影响,挑选其中样本量大于40例的研究,并将其测序方式限定为全基因组测序或者HBV探针富集后测序,最后共纳入4项研究[5,6,7,8],总结其HBVDNA整合坐标信息,合计共610例配对样品、16643个整合位点纳入研究。其中在Furuta等[7]捕获到的1683个整合位点中,有38个read不能映射到人类基因组(GRCh37,UCSCreleasehg19),因此去除这38个read数据。之后,本课题组汇总整合位点,将其映射到同一版本的人类基因组(hg19),并将4项研究检测到的总整合数标准化至同一水平,以增加数据可比性,减少后续结果的偏倚。
癌症基因组图谱(TCGA)[9]中截至2020年7月收录的肝癌患者的临床信息和样本对应RNA(WorkflowType:HTSeq-FPKM)信息全部从官网(https://portal.gdc.cancer.gov/)下载,并同时获取相应患者的临床资料。利用Rstudio软件(3.6.1版)对其进行筛选分析。
HepG2细胞系的GRO-seq(GlobalRun-OnSequencing)数据从GEO下载(GSE120105)[10]。
随机片段的生成:利用python中的random模块,随机生成长度为2bp的5000个随机片段用于后续分析。
二、数据的生物信息学分析
数据整合后,利用bedtools(2.27.0版)定位在人基因组(GRCh37,UCSCreleasehg19)的HBVDNA整合信息,并比对其是否位于RepeatMasker(chromOut.tar.gz,UCSC)区域,后通过ChIPseeker[11](v1.22.0,R包)获得其在基因上的位置(外显子、内含子、启动子等),再利用bedtools计算HBVDNA整合位点到转录活性位点的距离。
三、统计分析方法与作图
利用circos(version0.69-6)将HBVDNA整合位点投射到全基因组并将之可视化,余图采用GraphPadPrism8绘制。利用Rstudio(3.6.1版)进行统计学分析。采用χ2检验、Wilcoxon符号秩检验进行比较。以log2差异倍数的绝对值>1作为筛选标准得到差异表达基因。以P<0.05为差异有统计学意义。
结果
一、人肝癌组织、癌旁组织中HBVDNA整合位点分布及对比
肝癌组织中共检测到6948个整合位点分布在所有染色体上(图1A)。相较于随机分布,其整合具有一定的染色体偏好性,优先整合至第5号染色体(14.7%vs5.8%,χ2=128.785,P<0.001)、第8号染色体(7.7%vs4.7%,χ2=23.097,P<0.001)、第13号染色体(8.1%vs3.7%,χ2=52.031,P<0.001)、第17号染色体(6.7%vs2.6%,χ2=56.485,P<0.001)、第19号染色体(8.6%vs1.9%,χ2=135.264,P<0.001,图2A)。优先整合至重复序列区域(56.9%vs45.4%,χ2=79.842,P<0.001,图2B),在重复序列的子分类中,整合位置亦存在偏好性:优先整合至简单重复序列(17.2%vs1.7%,χ2=195.955,P<0.001)、卫星重复区间(12.9%vs1.1%,χ2=148.485,P<0.001,图2C)。在基因上,优先整合至外显子(6.4%vs3.5%,χ2=61.509,P<0.001,图2D)。
癌旁组织合计6657个整合位点,HBVDNA整合分布在所有染色体上(图1B)。相较于随机对照组,优先整合到第2号染色体(13.8%vs7.9%,χ2=54.128,P<0.001)、第4号染色体(9.5%vs6.2%,χ2=23.085,P<0.001)(图2A)。相较于基因间,在癌旁组织中倾向于整合至基因内(31.4%vs23.0%,χ2=53.491,P<0.001,图2B)。在重复序列的分类中,HBVDNA倾向于整合至简单重复序列(5.5%vs1.7%,χ2=28.486,P<0.001)、低复杂度重复区间(3.5%vs0.8%,χ2=23.678,P<0.001)、卫星重复区间(2.6%vs1.1%,χ2=8.472,P<0.01)(图2C)。在基因主体上,无明显整合偏向性(图2D)。
比较肝癌组织与癌旁组织整合情况,肝癌组织相较于癌旁组织,在染色体分布上,优先分布于第5号染色体(14.7%vs5.1%,χ2=128.785,P<0.001)、第8号染色体(7.7%vs5.4%,χ2=12.903,P<0.001)、第13号染色体(8.1%vs2.9%,χ2=77.595,P<0.001)、第17号染色体(6.7%vs1.7%,χ2=95.702,P<0.001)、第19号染色体(8.6%vs2.1%,χ2=127.492,P<0.001)、第X号染色体(2.6%vs1.5%,χ2=8.568,P<0.01)、第Y号染色体(2.5%vs0.4%,χ2=49.278,P<0.001)。在重复序列区域上,相较于癌旁组织,肝癌组织中HBVDNA更多整合到重复序列中(56.9%vs47.5%,χ2=53.119,P<0.001)中,特别是简单重复序列(17.2%vs1.7%,χ2=101.535,P<0.001)、卫星重复区间(12.9%vs2.6%,χ2=109.112,P<0.001)。在基因结构上,肝癌组织中HBVDNA更易整合至外显子上(16.4%vs2.0%,χ2=61.509,P<0.001)。
二、在肝癌组织中HBVDNA高频整合的热点基因
所有HBVDNA整合事件中,共1045个位点整合至基因内部。依据泊松分布,取P<0.05(对应整合数量临界值为7),鉴定66个热点基因(图3A)。为了进一步探究整合的可能相关因素,本研究利用TCGA中为HBV诱发肝癌患者的转录组测序数据,对比热点基因在肝癌组织和癌旁组织中转录组水平表达量的差异(图3B)。根据这66个基因的RNA表达水平进行聚类分析,可以将样本区分为两类,并且该分类与样本的临床特征相符,即肝癌组织与癌旁组织。本课题组猜测这可能与HBVDNA整合偏好性有关,即HBVDNA可能倾向于整合转录活跃的区域。
图1HBVDNA在肝癌组织(A)和癌旁组织(B)中的整合情况
图2HBVDNA在肝癌组织、癌旁组织中的整合模式
三、在肝癌患者肝癌组织和癌旁组织中HBVDNA整合位点与转录活性位点的关系
为了进一步验证HBVDNA整合与转录活性之间的关系,本研究利用肝癌细胞系HepG2的GRO-seq数据。不同于传统的RNA测序表现的是RNA的稳态水平,GRO-seq表现的是转录活动本身[12]。因而,借助GRO-seq数据,可以更好地揭示HBVDNA整合与转录活性的关系。本研究将4种样本中检测到的所有整合位点,去除与重复序列库重复的整合位点后,将剩下的整合位点(癌组织2202个,癌旁组织3375个)与HepG2的GRO-seq的数据进行比较,比较整合位点与转录活性区域在空间上的距离分布关系(图4A)。结果显示,相较于预测值,在肝癌组织癌旁组织中,与随机对照组相比,有更多的HBVDNA整合位点位于转录活性区域上下游1000bp的范围内:肝癌组织33.4%(χ2=43.463,P<0.001),癌旁组织33.1%(χ2=39.600,P<0.001),但是肝癌组织和癌旁组织分布差异均无统计学意义(33.4%vs33.1%,χ2=0.091,P=0.763)。
图3肝癌组织中HBVDNA高频整合的热点基因在全染色体上分布情况及其转录水平
进一步,在距离转录活性位点上下游1000bp以内的范围内,本课题组比较HBVDNA整合位点在肝癌组织和癌旁组织的分布(图4B),发现有更多的整合位点位于转录活性区域上:随机序列中仅为3.36%,与随机对照相比,肝癌组织中8.5%整合位点位于转录活性区域(P<0.001),癌旁组织中9.0%整合位点位于转录活性区域(P<0.001),同样,肝癌组织和癌旁组织的分布差异无统计学意义(8.5%vs9.0%,χ2=0.471,P=0.492)。
接下来,依据泊松分布,本课题组将一个基因存在7种以上的整合定义为热点基因,即将整合位点按照基因的整合频率进行分类,分为高频整合基因组和和非高频整合基因组。本课题组发现尽管高频整合基因组中HBVDNA整合仅377个,有16.5%的整合位点于转录活性区域;而非高频整合基因组有1825个,仅有3.0%位于转录活性区域,高频整合基因组中更多整合位点位于高转录活性区域(图4C,P<0.001)。由此,本课题组得出结论,相较于随机分布的预测值,肝癌组织和癌旁组织中HBVDNA更易整合至转录活性区域;并且在肝癌组织中,高频整合基因组中,更多整合位点位于活性转录区域。
图4HBVDNA整合位点与转录活性的关系
讨论
本研究通过分析、总结并比较既往研究中已发表的肝癌患者肝癌组织、癌旁组织中HBVDNA整合位点,发现其在肝癌组织、癌旁组织分布不全相同,这一结果在多项研究中得到证实[5,6,7,8]。这种分布特点可能是在肝炎感染阶段,某些位置的插入整合获得了肿瘤进化优势,进而在肝癌演变中得以富集,并在肝癌组织中展现出来。然而,在本研究中,本课题组发现癌旁组织中HBVDNA整合位点分布与肝癌组织有一定程度的相似,因此癌旁组织可能处于向癌症转化的中间阶段,即可能已具有肝癌组织的部分特性。这也提示,目前在多数肝癌研究中,癌旁组织多作为正常组织进行对照以发现肝癌组织中某些特性,但这种对照可能会掩盖一部分信息。因而在后续肝癌研究中,更应该增加肝炎等组织样本作为正常组织进行对照以发现肝细胞癌变特性。
本研究发现大量的HBVDNA插入整合到了基因组上的重复序列,这点与其他研究者的发现相同[13],进而利用这种特征,HBVDNA插入整合至重复序列区域可能赋予了细胞某种生长优势进而这种特征得以保留。同时,在一项针对HBV阳性的肝细胞系进行RNA测序研究中发现,HBX-LINE1的融合转录本可以激活Wnt/β-catenin信号通路促进癌症发生[14]。而整合插入后发生的改变是多方面的:进一步加剧基因损伤,加重染色体不稳定性,造成基因突变或改变转录本,进而改变基因转录水平,即肝癌发生的内在驱动力[13,15],如在一项研究中发现HBVDNA在锌指蛋白ZBTB20位点整合可能会导致ZBTB20(zincfingerandBTBdomaincontaining20)表达水平下降,从而促发肝细胞异常增殖[16]。
而对于HBVDNA整合位点的偏向性研究方面,通过与HepG2的转录活性数据比对,本研究发现HBVDNA倾向于整合至高转录活性区域。本课题组考虑这可能是由两方面原因造成的:首先,高转录活性位点易发生DNA双链断裂,这可能与转录中形成的特定的染色质模式相关[3,4],所以HBVDNA更易整合至这些脆弱区域。其次,插入整合至转录活性区域后的改变可能更具功能,进而在进化中更容易保留,在研究中发现HBVDNA插入整合至端粒酶逆转录酶(telomerasereversetranscriptase,TERT)基因的启动子区后,TERTmRNA表达增加和更具侵略性的肿瘤行为有关[17]。这个发现具有一定的临床意义:首先,在肝癌发生机制上,HBVDNA整合至高转录活性区域,可能增加其基因组不稳定性,提示HBV感染作为肝癌发生的驱动力的另一相关机制,有助于进一步了解肝癌发生发展机制;其次,在肝癌发生发展过程中,HBVDNA整合至高转录活性区域,可能改变原有基因的转录情况,并且这种变化可以作为标志物对患者预后作早期判断;最后,在治疗上,HBVDNA整合至高转录活性区域,形成嵌合蛋白可能性增大,设计特异性识别该嵌合肽段的基因工程T细胞,实现对肝癌细胞的特异性杀伤及肝癌的精准治疗,最终实现改善患者预后,延长生存时间的目标。
然而,肝癌组织与癌旁组织中转录活性位点插入整合频率差异均无统计学意义。这个原因可能是由于纳入研究其所采用的测序方法不尽相同,Sung等[5]和Zhao等[6]采用的是全基因组测序,而Furuta等[7]和Yang等[8]采用的是基于HBV探针富集后的测序,因为两种方法的灵敏度和特异度不同,导致插入整合位点的实际整合数量相对不准确。但是考虑到HBVDNA插入整合高度异质,可能存在一种现象,即某HBVDNA整合位点在组织中被多次整合或获得进化优势,大量克隆,现有的分析方法无法分辨,所以实际分布可能有所影响。
综上所述,本研究采用生物信息学方法对既往研究中来自肝癌组织、癌旁组织中HBVDNA整合位点数据汇总分析,发现在肝癌样本中HBVDNA整合具有特征性分布,其插入整合位点可能与该位点转录活性相关。本研究尽管阐明了HBVDNA整合的部分特征,还需要更大样本量进一步分析以阐明其在肝癌发生、发展过程中起到的作用。此外,整合事件可能与转录活性相关,但是具体的发生机制仍需要进一步研究以阐明。
文章来源:奚小荔,杨碧兰,董俊超,吴斌,杨逸冬.基于生物信息学的肝癌HBVDNA整合特征研究[J].中华消化病与影像杂志(电子版),2021,11(04):152-157.
分享:
原发性肝癌(primaryhepaticcarcinoma,PHC)是影响我国人民生命健康的恶性肿瘤,发病率位居全部恶性肿瘤的第4位,病死率居第2位[1-2];其中,乙型肝炎(乙肝)相关性PHC是我国肝癌的最主要临床类型,约占全部PHC的77.0%[3]。PHC的特点是恶性程度高,预后差。
2025-08-28肝细胞癌是我国常见的恶性肿瘤之一,其发病率和死亡率分别位居我国恶性肿瘤的第4位和第2位[1]。肝癌在早期阶段往往缺乏显著症状,导致多数患者在确诊时病情已进展至局部晚期或伴有远处转移,从而使得手术治疗难以达到根治的目的。目前,除靶向免疫等系统治疗外,放射治疗是肝癌常用的局部治疗手段之一[2]。
2025-08-27原发性肝癌(PHC)作为一种消化道恶性肿瘤,在我国具有较高的发病率、病死率[1]。该病症通常起病较为隐匿,很多患者在确诊时已进入中晚期,从而错过最佳的治疗窗口,不利于预后[2]。因此,实现PHC的早期发现与及时治疗,对于提高患者的治疗效果和生存率,具有极其关键的临床价值。
2025-08-22肝癌为临床多发恶性肿瘤,由于疾病发病较隐匿,故50%~75%患者确诊时已属中晚期,丧失根治性手术治疗时机[1]。载药微球—肝动脉化疗栓塞(DEB-TACE)为中晚期肝癌重要治疗措施,可通过栓塞及细胞毒作用致病灶坏死,但DEB-TACE所致缺氧缺血可上调血管内皮生长因子表达,促使肿瘤血管新生,导致疾病治疗失败[2]。
2025-08-22临床研究显示,原发性肝癌发病相对较为隐蔽,无特异性,多数患者在诊断时已处于中晚期,严重危及生命安全[2]。长期以来,临床主要通过手术方式治疗原发性肝癌,但随着疾病的发展及恶化,部分患者合并慢性肝炎和肝硬化,肝脏整体能量储备能力差、手术耐受性不高,多选择介入方式治疗。在此阶段,患者身心均承受较大的压力。
2025-08-13原发性肝癌(以下简称肝癌)是全球范围内发病率和死亡率均较高的恶性肿瘤之一,5年生存率仅为12%~15%,发病机制复杂,早期症状隐匿,多数患者确诊时已处于中晚期,治疗难度大、预后差[1]。中医药基于整体观念及辨证论治原则,在改善症状、增强免疫、减轻放化疗毒副作用等方面具有显著优势[2]。
2025-08-07目前临床多采用国际推广的三阶梯止痛疗法规范控制疼痛,但多数癌痛止痛药成瘾性高,不良反应多,如常用的阿片类药物除成瘾性外还可导致抑制呼吸、便秘等毒副作用,并且大剂量使用止痛药会造成肝功能的损伤,因此目前有10%~20%的恶性肿瘤晚期患者的癌痛止痛效果不佳[3⁃5]。
2025-07-28血清肿瘤标志物如癌胚抗原(CEA)、甲胎蛋白(AFP)是两种常用的血清肿瘤标志物,能够在一定程度上反映肝癌的存在和进展。通过对这些标志物的检验,临床医生可以辅助进行肝癌的早期筛查、病情评估及治疗效果监测。CEA是一种糖蛋白,主要用于评估结直肠癌及其他一些消化道癌症的诊断和预后[2]。
2025-07-21钇-90树脂微球选择性内放射治疗(yttrium-90selectiveinternalradiationtherapy,90Y-SIRT)是指利用选择性动脉插管的方法在肿瘤区域中注射载有放射性核素90Y的微球,90Y能够发射纯β射线,利用电离辐射杀伤肿瘤组织,从而控制肿瘤进展。
2025-07-09肝癌是我国常见的消化道恶性肿瘤,其主要症状之一是癌痛,严重影响患者的日常生活质量,甚至可能降低肿瘤的治疗效果,延长住院天数,加重患者家庭经济负担[1~3]。目前使用的各类止痛药物如非甾体类抗炎药或阿片类药物,虽然疼痛可得到暂时缓解,但长期使用有成瘾性、耐药性等不良反应[4]。
2025-07-01人气:18227
人气:17626
人气:17209
人气:16274
人气:15007
我要评论
期刊名称:肝癌电子杂志
期刊人气:2025
主管单位:国家卫生和计划生育委员会
主办单位:人民卫生出版社
出版地方:北京
专业分类:医学
国际刊号:2095-7815
国内刊号:11-9351/R
创刊时间:2014年
发行周期:季刊
期刊开本:16开
见刊时间:10-12个月
影响因子:1.474
影响因子:2.876
影响因子:0.899
影响因子:0.000
影响因子:2.153
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!