摘要:三维基因组学是研究基因组三维空间结构与功能的一门学科.基于不同的研究目的和生物学问题,目前发展出了各种各样的三维基因组学研究方法,这些方法对推动三维基因组学发展有积极的影响.本文以三维基因组学的提出和发展过程为线索,对三维基因组学的主要研究方法进行了系统地归类与介绍,包括基于测序技术(基于邻近连接)的Hi-C,captureHi-C,single-cellHi-C,DLOHi-C,ChIA-PET,Hi-ChIP等;基于测序技术(不基于邻近连接)的ChIA-Drop,SPRITE,GAM;以及基于影像技术的seqFISH,CRISPRainbow,SABERamplifiesFISH.最后,本文对染色体构象捕获技术的发展方向进行了简单的展望.
加入收藏
人类基因组包含2万个编码基因以及大量的调控元件.在过去的10年时间里,研究人员根据细胞类型的不同,把活跃在不同细胞中的调控元件进行了聚类[1].DNA元件百科全书计划、表观组学线路图计划、人类表观遗传学合作组织以及哺乳动物基因组的功能性注释计划已经注释了数千个基因,以及数百万个与这些基因相关的调控元件[2,3,4,5].但是,这些调控元件是如何跨越几千碱基甚至上百万碱基的距离对靶基因发挥调节作用,还没有清晰的解释[6].
染色质的空间折叠及其在细胞核中的结构对核内基因的表达有深远的影响.例如,增强子必须要与目的基因发生空间上的互作,才可以激活目的基因的表达[7,8,9],并且基因的沉默以及基因组DNA的复制都与染色质的折叠密切相关[10,11].此外,全基因组关联分析已经确定了大量与疾病相关的突变位点,这些突变位点大部分都是位于非编码区的潜在调控元件[12].癌细胞中存在大量的基因重排现象,这都与基因组DNA的三维结构有或多或少的联系[13,14].2017年,研究人员通过对哺乳动物早期胚胎发育过程中染色体三维结构重构过程的解析,发现了染色体三维结构在受精初期呈现出极其松散的状态,且不具有任何的TAD[15],A/Bcompartment[16]等结构特征.随着胚胎的发育,染色体的三维构象及高级结构才慢慢成熟建立[17].随后,2018年研究人员发现,在甲型流感病毒感染期间,转录紊乱导致的RNA聚合酶Ⅱ过度转录延伸会迅速改变宿主细胞染色质的相互作用.这些互作的改变通常发生在高转录水平基因的3′末端.此外,为了利于转录因子的结合,转录延伸会将处于转录抑制状态的染色质区域转换为转录激活状态的染色质区域[18].这些研究成果都说明了染色质三维结构与转录调控之间的紧密联系,也为揭示疾病发生的深层次原因提供了理论基础.
为了解决不同的生物学问题,现阶段发展出各式各样的染色体构象捕获技术,大部分技术都是基于邻近连接来固定染色体互作信息,包括Hi-C[16], ChIA-PET[20]等.这样做的优势是可以简单迅速地通过酶连反应将远距离染色体的互作信息固定下来.但是邻近连接对染色体间互作的捕获能力有限,为了获取更丰富的基因组互作信息,近期研究人员开发了几种不依赖于邻近连接的染色体构象捕获技术,包括基于“拆分池”的SPRITE技术[21],基于10xGenomics[22]测序平台的ChIA-Drop技术[23]以及基于冰冻切片的GAM技术[24].利用这些技术,研究人员描绘了由核体介导的染色体间互作模型[21],并且观测到了由RNA聚合酶Ⅱ转录延伸所导致的染色体三维结构的改变[23].以上提出的所有高通量染色体构象捕获技术,都依托二代或三代测序平台来读取基因组互作信息.为了直接肉眼观测到染色质的空间结构,研究人员将CRISPR技术应用在基因组标记中,开发出可对活细胞基因组多位点同时标记的CRISPRainbow技术[25],该技术能够同时标记多达7个不同位置的基因组位点,每种位点对应一种不同的颜色,允许人们实时追踪染色体构象的改变.此外,庄小威课题组[26,27]将超分辨显微镜技术与原位杂交技术相结合,成功观测到了染色质的具体互作情况.
针对目前已经开发的三维基因组学技术,本文进行了整理和归类,为相关学者和研究人员提供参考(表1).下文进行相关的介绍.
1、测序技术(基于邻近连接)
1.1染色体构象捕获技术
针对不同的研究目的,三维基因组的研究方法有很多.最早的染色体构象捕获技术(3C),是在2002年由Dekker等人[19]提出来的.该方法首先会对细胞核进行甲醛固定,甲醛的交联作用可以将细胞核内的互作DNA与蛋白交联在一起,把全基因组范围内的基因组互作信息都固定下来;再通过限制性内切酶酶切、扩大反应体积邻近连接,将线性距离很远、但空间距离很近的两个调控区域酶连在一起;最后通过荧光定量PCR,验证感兴趣的基因组互作是否真实发生.3C技术的建立,在DNAFISH [39]之外,首次提供了一种对染色体空间构象研究的方法,开创了基因组学研究的新领域.
1.2Hi-C技术
由于3C技术提出的年代较早,高通量测序技术还没有普及,所以3C有个很大的缺陷就是通量太低,只能对一对基因组互作位点进行验证.随着高通量测序的发展,Dekker课题组[16]将高通量测序技术与3C相结合,于2009年发表了Hi-C技术.Hi-C技术将3C文库构建过程进行了改进:当染色质酶切结束后,用生物素修饰的核苷酸对DNA黏性末端进行标记,然后再进行邻近连接;连接结束后,用超声的方法对回收的连接产物进行打断,然后再用链霉亲和素回收互作DNA结点;最后将回收的互作DNA构建成高通量测序文库进行高通量测序.
通过对Hi-C数据的分析,研究人员发现,基因组按照互作模式的不同可以划分为两类不同的区间,也叫做A/Bcompartment[40].Acompartment一般处于常染色质区,这个区域基因转录活性较高,基因调控元件大量结合,是一个较松散的染色质区域.而Bcompartment处于异染色质区域,该区域基因的转录活性较低,基因组紧密包裹,调控元件往往很难在该区域结合.
如果进一步对A/Bcompartment进行划分,基因组可以被划分为更小的、一般以Mb大小为单位的拓扑结构域——TAD[11].TAD是基因组折叠的单元,在一个TAD结构内部,大量的转录调控元件折叠在一起,互作紧密,而在不同的TAD之间,互作较少.
表1主要染色体构象捕获技术比较及其技术特点
由于测序深度的限制,以前的Hi-C数据分辨率较低,难以捕获近距离的启动子和增强子互作信息,只能在Mb或者几十kb的分辨率下对A/Bcompartment以及TAD进行分析.2014年发表的原位Hi-C(insituHiC)[28]对传统的Hi-C方法进行了优化,采用4碱基酶(MboI)以及核内邻近连接的方法,在有足够测序深度的情况下,将Hi-C的分辨率提高到1kb.通过原位HiC,研究人员阐明了CTCF蛋白是如何介导染色体折叠(loop)形成的,并在GM12878细胞系中,对9448个loop进行了注释.高分辨率的Hi-C数据可以将具体的启动子与增强子通过loop连接起来,精确地寻找某个启动子区域的调控元件.此外,研究人员利用基因组特异性杂交探针与Hi-C文库进行杂交,只对感兴趣的基因组调控区域及其互作区域进行捕获,选择性地分析癌症风险基因、易感基因等特定区域的基因组互作情况,这就是现在应用广泛的captureHi-C[29,30].
1.3单细胞Hi-C染色体构象捕获技术
传统的Hi-C技术是通过捕获群体细胞的平均染色体来解析一群细胞的染色体三维构象.2013年,为了解析不同单细胞间染色体构象的差异,Nagano等人[31]发表了单细胞Hi-C技术(single-cellHi-C),该技术以Hi-C技术为基础,以单个细胞核为研究对象,能够分辨单细胞染色体的构象模型,并阐明染色体的相互作用以及基因组功能的受控机制.不同组织类型的单细胞染色质三维结构的解析是现阶段表观遗传学的研究热点[41].但单细胞Hi-C技术基于传统Hi-C技术,需要生物素对染色体末端进行分子标记,且缺乏体外线性扩增的步骤,微量互作DNA的回收难度大,技术门槛很高,大部分实验室都难以进行单细胞Hi-C实验.后期慢慢发展出一些基于单细胞扩增的单细胞Hi-C技术,例如single-nucleusHi-C[32]和Dip-C[33].此外,研究人员还将原位Hi-C与“拆分池”技术[42]相结合,发明了sciHi-C(single-cellcombinatorialindexedHiC)[34].该技术用带有标签的DNA接头将每个细胞进行“打码”标记,然后进行混合、拆分,再经过测序接头的第二轮“打码”标记,将每个细胞都带上唯一的标记,最后混合建库、测序,这样就可以既看到“树木”,又看到“森林”地获取群体细胞和单个细胞的染色体互作信息.
1.4DLOHi-C
DLOHi-C(digestion-ligation-onlyHi-C)[35]最大的特点是采用同时酶切酶连的方式,将含有MmeI的DNA接头连接在染色体内切酶切口末端上,然后进行邻近酶连,最后用MmeI内切酶酶切消化,回收固定大小的互作DNA片段进行测序.DLOHi-C最显著的特征是引入了含有MmeI的DNA接头,通过凝胶电泳、切胶回收固定大小的互作DNA片段就可捕获染色体的互作信息,因此取消了繁琐生物素标记、链霉亲和素磁珠回收等步骤,大大地降低了背景数据噪音,获取了高质量的染色体互作数据,并可在测序前通过A、B两种接头的连接情况,预判文库中随机连接噪音的大小.此外,DLOHi-C使用EGS和甲醛水溶液对细胞进行双交联固定,可以捕获非直接接触的DNA-蛋白弱互作,同时避免后期实验过程中解交联的发生.与传统的Hi-C技术相比,DLOHi-C提高了测序数据利用率、缩短了文库构建时间、降低了文库构建成本.
1.5ChIA-PET
Hi-C捕获到的是全基因组范围内的互作信息,所有的调控元件都包含在其中.如果想对某个转录因子所介导的基因组互作进行分析,Hi-C的测序深度往往难以达到.2009年,也就是Hi-C建立的同一年,研究人员平行发表了另一种染色体构象捕获技术ChIA-PET[36].ChIA-PET技术将ChIP[43,44,45,46]技术与染色体构象捕获技术结合到一起,在染色体构象捕获过程中,加入了抗体富集的步骤,特异性地捕获感兴趣的转录因子或者其他调控元件介导的基因组互作信息[47].利用ChIA-PET技术,研究人员全面地描绘了CCCTC结合因子(CCCTC-bindingfactor,CTCF)与RNA聚合酶Ⅱ(RNAPII)共同介导的染色体折叠以及这些特异性的染色体折叠对转录活性的影响[8,48].
1.6HiChIP
由于ChIA-PET的初始细胞量较大,一般需要1×10[7]个细胞才可进行抗体富集及后期的文库构建,为了进一步提高捕获效率,研究人员将insituHi-C和转座酶Tn5介导的文库构建方法相结合,开发出了HiChIP [49]技术.HiChIP的前期步骤与insituHi-C[28]类似,在细胞核内对染色质进行限制性内切酶酶切、生物素末端标记以及邻近连接.当核内邻近连接结束后,研究人员对细胞核进行裂解、超声以及抗体富集,并对感兴趣的转录因子介导的染色质互作信息进行捕获.得到DNA-蛋白复合物后,进行解交联,再用链霉亲和素磁珠回收互作DNA结点,最后在链霉亲和素磁珠上直接进行转座酶Tn5介导的文库构建.HiChIP结合了insituHi-C和转座酶Tn5介导的文库构建的技术优势,大大地降低了起始细胞量,同时提高了DNA互作片段的捕获效率.
1.7其他基于邻近连接的染色体构象捕获技术
除了上述代表性的染色体构象捕获技术外,国内外开发了大量的高效的染色体构象捕获技术,包括利用DNA酶进行染色质片段化的DNaseHi-C[50]和insituDNaseHi-C[37];利用桥式接头(bridgelinkers)进行邻近连接的BLHi-C[51]和BATHi-C[52];利用苯酚氯仿对开放区域染色质互作片段进行分离的OCEAN-C[53];利用完整的高通量测序接头,直接与互作DNA片段进行连接,不通过PCR扩增直接测序的SAFEHi-C[54].这些优秀的染色体构象捕获技术在一定程度上推动着三维基因组学的发展.
2、测序技术(不基于邻近连接)
染色体间互作大部分都是核体(nuclearbodies)介导发生的[55],而核体的分子量和空间体积很大,直径可达0.5~2μm[56],互作的DNA距离很远,传统的邻近连接很难将染色体间互作信息捕获下来.近几年发表了几种不依赖于邻近连接的染色体构象捕获技术,分别是(GAM)[24], SPRITE[21]以及ChIA-Drop[23],本文分别对这几种技术进行简要介绍.
2.1GAM
GAM[24]将冰冻切片技术引入到染色体构象捕获中,将细胞核切成厚度为120nm的薄片,然后利用激光显微切割技术和全基因组扩增技术,将每一切片薄层内部的基因组互作DNA构建成高通量测序文库,最后测序、分析统计每一层的基因组互作情况,获取全基因组互作图谱.GAM技术不需要对细胞进行交联固定,不需要邻近连接,只需要几百个细胞即可获取基因组互作信息,其利用物理切片的方法研究基因组三维结构,具有很强创新性.
2.2SPRITE
SPRITE[21]则利用超声和酶解的方式,将染色质打断成150~1000bp的蛋白-DNA复合物,然后利用“拆分池”的方式,将蛋白-DNA复合物的末端连接上带有特异识别序列的DNA标签接头,然后进行混合、拆分、加第二轮DNA标签接头,如此反复,这样可以把每个单分子蛋白-DNA复合物的互作DNA末端都带上相同且区别于其他蛋白-DNA复合物分子的标签,最后通过建库测序,获取每个蛋白-DNA复合物分子的DNA互作信息.SPRITE很好地解决了邻近连接的技术缺陷,绘制出了更为精细的染色体间的互作图谱.
2.3ChIA-Drop
2019年发表的ChIA-Drop[23]将ChIA-PET和微流控技术(如10xGenomics平台)结合在一起,其先将染色质片段化成6000bp左右,然后用抗体对片段化的染色质进行特异性富集;结束后,将染色质单分子利用10xGenomics平台配套试剂盒以及特异性的标签引物混合制备成“油包水”的小液滴;对每个小液滴进行单分子扩增以及标记后,利用高通量测序平台对其进行测序;最后获取每个蛋白-DNA复合物内部包含的DNA互作信息[23].
3、影像技术
3.1CRISPRainbow
为了直接肉眼观测到染色质的空间结构,2016年,来自麻省大学医学院的科学家开发出了基于CRISPR/Cas9[57,58,59]的染色体实时示踪技术:CRISPRainbow[25].该技术将guideRNA(gRNA)进行了改造,让其能与不同颜色的荧光蛋白特异地结合在一起.不同颜色的排列组合,可以对不同的基因组位点进行区分,允许人们实时追踪染色体构象的改变.CRISPRainbow能够同时确定多达6种不同的DNA位点,每种位点对应一种不同的颜色.在活细胞中采用CRISPRainbow能够追踪基因组动态的拓扑运动,具有重要的生物学意义.
3.2seqFISH
同样基于显微成像技术,庄小威课题组[26,27]将超分辨显微镜技术与RNA原位杂交测序技术[60,61,62]相结合,开发出针对于基因组DNA的seqFISH技术,并成功观测到染色体的精细结构.定位特定区域在基因组上的互作情况一般分为两步:第一步是杂交阶段,该阶段将第一轮杂交探针与染色体进行杂交,每个杂交位点的范围为30kb,其中均匀分布300条杂交探针,每条杂交探针有一个25bp的显色探针杂交区;第二步是显色阶段,这一步会用带有荧光的针对于第一个杂交位点的显色探针,与杂交探针的25bp的显色区进行杂交,然后显微成像、光淬灭,再用带有荧光标记的探针对第二个杂交位点的显色探针与杂交探针的25bp的显色区进行杂交,然后显微成像、光淬灭,如此反复,获取某一特定区域的基因组互作情况[27].基于原位杂交与显微成像的染色体构象捕获技术,不仅可以分析基因组特定位点的空间互作情况,还可以观测这一区域在细胞核中的位置分布,应用前景广阔.
3.3SABERamplifiesFISH
在seqFISH中,一般一条杂交探针只结合一条显色探针,为了检测一个位点的荧光信号,往往需要数百条杂交探针进行杂交与显色[27],缺少杂交信号放大的步骤.2019年发表的SABERamplifiesFISH[63],将交换反应信号扩增技术引入FISH中,通过引物交换反应[63],将普通的FISH探针加上长单链DNA串联体,在串联体上可杂交多个互补荧光成像单链以放大FISH信号.利用SABER进行信号扩增放大与传统的RCA[64]和HCR[38,65,66]扩增放大技术相比,有以下5个优势:(ⅰ)信号扩增可控性高,效率高;(ⅱ)能够对多条杂交探针信号同时进行扩增放大;(ⅲ)扩增后的探针具有很高的杂交效率;(ⅳ)扩增后探针的杂交与成像步骤简单;(ⅴ)扩增成本较低.利用SA-BERamplifiesFISH,研究人员成功解析了人类X染色体的空间结构.
4、展望
由于组织样本的异质性高,很难获取高纯度的组织细胞样本,而Hi-C实验又要求较大的起始细胞量,所以现阶段进行染色体构象捕获实验的样本,大部分还是细胞系.虽然现阶段开发了一些基于微量细胞和单细胞的染色体构象捕获技术,但由于其实验操作难度大,只有极少数实验室在进行单细胞和寡量细胞HiC的实验,后期需开发一些简单、可靠、重复性好的针对于微量细胞的染色体构象捕获技术,来满足对微量组织样本的实验需求.此外,由于技术原因,以前的染色体构象捕获技术对染色体间的互作捕获能力非常有限,导致主要研究都集中在染色体内互作,对染色体间互作情况知之甚少.后期需要开发更多的不基于邻近连接的、简单且易操作的染色体构象捕获技术,来观测不同细胞周期、不同发育阶段、不同生理病理条件、不同药物处理后的细胞染色体间互作情况,为探索细胞转录调控和表观遗传研究奠定基础.
林达,张斯姮,张智慧,徐伟泽,洪萍,李国亮,曹罡.探索染色质三维构象的“工具箱”研究进展[J].中国科学:生命科学,2020,50(05):497-505.
基金:国家自然科学基金(批准号:31771402,31900432);博士后创新人才支持计划(批准号:BX20180113);中国博士后科学基金(批准号:2018M640710)资助.
分享:
痤疮是常见的皮肤炎症性疾病,该疾病发病率高、易反复且机制复杂,主要以囊肿、丘疹、脓疱为主要症状,如若得不到有效治疗可导致永久性瘢痕,甚至毁容,给患者造成严重的健康和心理问题。目前,已经提出了用于痤疮的各种治疗剂,包括类固醇/抗生素,以抑制炎症或杀死细菌,然而这些治疗剂可能导致耐药病原体的出现以及副作用的产生。
2025-06-27急性移植物抗宿主病(acutegraft-versus-hostdisease,aGVHD)是异基因造血干细胞移植(alloHSCT)的常见并发症,也是造成移植失败及相关死亡的主要原因。aGVHD发生的关键是供体T细胞攻击含有异体抗原的宿主组织而引起的破坏性过程。CD8+T细胞是aGVHD的主要效应细胞之一。
2025-06-23氧化应激是由于促氧化剂和抗氧化剂之间的不平衡,导致大分子损伤和氧化还原信号传导和控制中断。氧化和自由基反应对细胞造成的破坏与癌症、冠心病、神经退行性疾病等疾病相关,而饮食中的天然抗氧化剂有利于降低这些疾病的风险。近年来,烷基间苯二酚(alkylresorcinols,ARs)作为饮食中的天然抗氧化剂受到广泛关注。
2025-05-24随着全球人口老龄化的加剧,认知异常和神经退行性病变成为日益严重的公共卫生问题。作为最主要的认知障碍性疾病,阿尔茨海默病(Alzheimer
2025-04-10镁离子是生物体细胞中最丰富的二价金属离子,对大多数生物体的生命活动都是至关重要的,其在细胞生命周期中参与了体内生物分子的合成、折叠和稳定。在人体细胞中,镁离子在心率、血压、神经肌肉传导、骨骼生长及葡萄糖代谢维持方面发挥重要作用。镁离子是生物膜与基因组稳定所必须的离子,生物体中有超过 600 种酶需要镁离子才能发挥其活性。
2025-03-25肾脏炎症和纤维化是急性肾损伤(acute kidney injury,AKI)和慢性肾病(chronic kidney disease,CKD)的关键病理特征,它们直接导致肾脏功能的持续退化。在这些病理过程中,TGF-β/Smad信号通路扮演着重要角色,而Smad3则是该通路中的关键效应因子。研究表明,Smad3不仅可被TGF-β1激活。
2025-01-16焦亡是由病原体相关的分子模式触发(PAMPs)或损伤相关分子模式(DAMPs)刺激的一种程序性坏死细胞死亡,包括细胞内脂多糖(LPS)、细胞外三磷酸腺苷(ATP)、胞质双链DNA、细菌鞭毛和颗粒物质。DAMPs激活模式识别受体(PRRs),组装形成炎性小体含NLR家族Pyrin域蛋白(NLRP3)后招募并活化半胱氨酸天冬酶(Caspase)-1。
2024-12-12自然杀伤(NK)细胞因具有独特的生物学特性、对肿瘤的细胞毒性、治疗安全性,在肿瘤免疫细胞治疗中备受关注[1]。但NK细胞属于较难扩增的免疫细胞,来源不足极大限制了NK细胞疗法的应用,如何体外高效扩增有活性的NK细胞是急需解决的难题之一[2]。
2024-10-08细胞衰老和纤维化是两个与许多疾病发展密切相关的生物学过程。细胞衰老是指细胞逐渐失去分裂能力和功能的过程,而瘢痕纤维化是创伤修复过程中形成的结缔组织增生和瘢痕形成的结果。细胞衰老可以分为:(1)驱动性细胞衰老:又称为“复制”衰老,由于DNA聚合酶不能完全复制滞后链,端粒会受到磨损。
2024-06-17本研究首次揭示了血红蛋白在正常组织中发挥的重要生物学功能,而且发现了血红蛋白独立于HIF之外的表达调控新机制。同时在本研究中,研究者发现了血红蛋白组成的新型细胞结构—hedy,这是除病理性血红蛋白聚集形成包涵体[2]之外,首次发现的细胞内具有生理性功能的血红蛋白聚集结构。
2024-06-17人气:4340
人气:3713
人气:2635
人气:2568
人气:2319
我要评论
期刊名称:生物学杂志
期刊人气:5016
主管单位:安徽省科学技术协会
主办单位:合肥市科学技术协会
出版地方:安徽
专业分类:生物
国际刊号:2095-1736
国内刊号:34-1081/Q
邮发代号:26-50
创刊时间:1983年
发行周期:双月刊
期刊开本:大16开
见刊时间:一年半以上
影响因子:1.343
影响因子:1.227
影响因子:1.286
影响因子:0.000
影响因子:1.349
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!