91学术服务平台

您好,欢迎来到91学术官网!站长邮箱:91xszz@sina.com

发布论文

论文咨询

探究挖掘栀子环烯醚萜类物质生物合成相关基因情况

  2020-06-19    450  上传者:管理员

摘要:为研究栀子中环烯醚萜类物质生物合成的分子机制,本研究以药用植物栀子果实为研究材料,利用Illumina HiSeq 4000对栀子进行转录组测序,利用Trinity软件对测序结果进行De novo组装,使用BLAST软件对Unigene进行分类、功能注释,通过MISA软件分析SSR位点。共组装获得75 539条Unigene,平均长度1 614 bp,在数据库的注释成功率为100%,共搜索到50 571个SSR位点,发现栀子转录组中有1 294个Unigene参与到16个与栀子次生代谢物质生物合成的代谢通路中,其中有77个参与环烯醚萜类物质生物合成。本研究初步获得栀子中参与环烯醚萜类物质合成的功能基因,不仅为开展栀子功能基因的鉴定和克隆提供基础序列,还为后续开展栀子药效成分生物合成的分子机制提供依据。

  • 关键词:
  • 栀子(Gardeniae fructus)
  • 环烯醚萜类
  • 茜草科
  • 药效成分
  • 转录组
  • 加入收藏

栀子(Gardeniae fructus)是茜草科植物栀子(Gardenia jasminoides Ellis)的干燥成熟果实,具有清热利湿、凉血解毒、泻火除烦、消肿止痛等功效(国家药典委员会,2015,中国医药科技出版社,pp.173)。大量研究表明环烯醚萜类、有机酸类和黄酮类是栀子的主要有效成分(杨全军等,2010,中国现代中药,9(12):7-12)。环烯醚萜类化学成分是栀子发挥疗效的主要物质基础,代表物质为栀子苷,具有镇痛、抗炎、解热、保肝利胆等作用。环烯醚萜类化合物(Iridoids)是一类环状单萜衍生物,其基本单元环烯醚萜醇具有环状烯醚及醇羟基,性质活泼,一般以苷类存在(吴昕怡和刘小莉,2017)。

栀子在药效成分、药理作用(李兆星等,2017,中药材,40(2):498-503)等方面已有广泛研究,但其药效成分生物合成途径的研究较少。环烯醚萜类物质生物合成途径的有关研究仅限于上游萜类骨架形成相关的酶(Sun et al.,2012),而合成途径下游相关功能基因的研究还未见报道,特别是栀子中栀子苷类物质生物合成相关研究报道较少。转录组学是研究细胞中基因转录的情况及转录调控规律的学科,通过转录组测序及生物信息学分析,可从中挖掘与研究相关的功能基因,进而揭示该生物过程的分子机制,对于基因组信息匮乏的药用植物开展基因结构和功能的研究很有帮助。目前,西洋参(Wu et al.,2013)、银杏(刘伟等,2018)、国槐(潘媛等,2018)、黄连(丛琨等,2018)、三七(黄勋等,2017)等药用植物都开展了转录组学研究,获得了大量转录组信息。本研究通过对栀子果实进行转录组测序,试图初步获得栀子中参与环烯醚萜类物质合成的功能基因,为后续开展栀子药效成分生物合成的分子机制提供依据。


1、结果与分析


1.1栀子转录组测序数据分析

通过对栀子的果实进行转录组测序,共获得了55 327 054个Raw reads,对获得的Raw reads进行数据过滤后得到54 269 850个Clean reads,Q20、Q30分别为97.97%和94.09%,GC%含量为44.16%。从测序产出数据质量评估结果可见,本次测序数据饱和度较高,为后续转录本的拼接提供了良好的数据支撑。本研究采用软件Trinity(Grabherr et al.,2011)对Clean reads进行拼接组装,共获得95 676个转录本(Transcripts),平均长度1 180 bp,‘N50’为2 624 bp。并对得到的Transcripts序列进一步组装获得75 539条Unigenes,平均长度1 614 bp,‘N50’为2 695 bp。长度在200 bp~500 bp的Unigene序列有10 222条,占总体的13.53%;有13 359条Unigenen的长度聚集在500 bp~1 000 bp,占总Unigene数的17.68%;有22 111条Unigenen的长度聚集在1 000 bp~2 000 bp,占总Unigene数的29.27%;有29 847条Unigenen的长度超过2 000 bp,占总Unigene数的39.51%(表1)。

1.2序列比对与注释信息

通过搜索工具Blast X将上述组装获得75539条Unigene与各大数据库进行比对,所有的Unigene都获得注释信息。结果表明(表2),NR数据库注释了60 902条Unigene,注释信息最多,占全部的80.62%;其次是Swiss prot注释到48 083条(63.65%)、PFAM注释到46 385条(61.40%)和GO注释到46 385条(61.40%);KOG注释到20 951条Unigene,注释量最少,仅占27.73%。

Unigene在Nr数据库中比对发现与栀子同源性序列比例最高的物种是茜草科植物中果咖啡(Coffea canephora)(图1),达79.9%;其次是芝麻(Sesamum indicum)和油橄榄(Olea europnea),分别为1.9%和1.8%;占比低于1%的物种归为一类(其他),共占13.9%。

1.3 Unigene的分类

KOG数据库是同源聚类基因群的专业数据库,通过对栀子转录组进行KOG功能分类预测,共有23 756条Unigene获得注释信息,并被分为25类,其中所占比例最高的是‘一般功能预测’(General function prediction only),注释到3 124条,占总Unigene的13.15%;最少的是细胞运动性(Cell motility),仅有5条,占0.02%;功能未知的Unigene有1 443条,占总数的6.07%(图2)。

表1栀子转录组组装拼接情况统计

表2 Unigene在数据库中的注释分布

图1 Nr库中的主要物种分布

在GO注释信息中有46 358条Unigene被分为3大类,55小类(图3)。其中生物学过程分类中细胞过程注释到的Unigene最多,有27 057条,细胞成分分类中细胞注释到得最多,有14 066条,分子功能分类中结合蛋白注释到的最多,有28 103条(图3)。

1.4 KEGG注释分析

KEGG数据库能够对各基因产物在其体内或细胞内的代谢途径进行系统分析,并且能够综合分析这些基因产物的功能,通过KEGG注释,可以深度挖掘不同研究所需要的功能基因。通过对Unigene进行KEGG代谢通路分析,发现有26 066条Unigene参与到了130条代谢通路中。其中,碳代谢(ko01200)包含的Unigene数目最多,有987条;其次是氨基酸生物合成(ko01230),有782条;异黄酮生物合成(ko0-0943)和甜菜色素生物合成(ko00965)通路中富集到的Unigene仅有6条和4条(图4)。

图2 Unigene的KOG功能聚类

对不同代谢通路进行综合分析,与萜类生物合成有关的Unigene有552条,与黄酮类生物合成有关的Unigene有131条,有470条Unigene与苯丙素生物合成有关,有141条Unigene与生物碱生物合成有关(表3)。可见,栀子体内存在多条次生代谢途径和多个相关基因,其次生代谢生物合成途径十分复杂,构建栀子转录组数据库,有助于后续开展新化合物的分离及阐明药效物质基础理论。

图3 Unigene的GO分类

1.5环烯醚萜类物质生物合成相关基因的挖掘与分析

栀子药材中主要的药效物质是环烯醚萜类化学成分,该类物质的生物合成途径研究还不是十分深入。一般来说,萜类化合物的生物合成过程被分为了3个阶段,首先是IPP和DMAPP的生成(中间体的生成)、接着是催化中间体生成各种萜类(萜类化合物的合成)和最后是对萜类终产物进行复杂的结构修饰(后修饰),栀子中的环烯醚萜类物质也与上述萜类化合物的合成有相类似的途径。一般在植物体内,萜类合成的中间体IPP和DMAPP的头尾相互结合行成香叶基二磷酸酯(geranyl pyrophosphate,GPP),然后GPP在香叶醇合成酶(geraniol synthase,GES)的催化下生成香叶醇(Sung et al.,2011)。接着,香叶醇在催化酶-香叶醇脱氧酶(geraniol 10 hydroxylase,G10H)的催化作用下形成10-羟基香叶醇,再由10羟基香叶醇氧化还原酶(10-hydroxygeraniol oxidoreductase,10-HGO)催化10-羟基香叶醇而形成10-氧香叶醛(Verma et al.,2012;徐小博等,2018)。在整个合成途径中最关键的步骤就是成环,即10-氧香叶醛由催化酶-环烯醚萜合酶(iridoidsynthase,IS)催化形成cistrans-nepetalactol和8-cpi-伊蚁二醛,cis-trans-nepetalactol在不同酶的催化下合成马钱子酸,8-cpi-伊蚁二醛在不同酶的催化下形成京尼平苷、梓醇等(Verma et al.,2012)(图5)。

本研究在栀子转录组中共筛选出6种共77条可能参与环烯醚萜类生物合成的相关酶基因。环烯醚萜类生物合成途径中第一个限速酶是5-磷酸脱氧木酮糖合成酶(DXS),经其催化能够合成磷酸脱氧木酮糖(DXP)。DXS的催化活性很高,经信号物质茉莉酸甲酯(MeJA)诱导能够显著提高其表达量(徐小博等,2018),共筛选出编码该种酶基因的20条序列;5-磷酸脱氧木酮糖还原异构酶(DXR)在合成途径中催化合成2C-甲基-赤藓糖-4-磷酸,是IPP的前体物质,共筛选出编码该种酶基因的6条序列;1-羟基-2-甲基-E-丁烯基4-焦磷酸还原酶(HDR)已在多种植物中克隆得到,其与环烯醚萜类成分含量有一定的相关性,但该反应不是环烯醚萜类合成的限速步骤,本研究共筛选出编码该种酶基因的6条序列;香叶醇-10-脱氢酶基因(G10H)是环烯醚萜类化合物生物合成途径的重要组分(吴昕怡和刘小莉,2017),共筛选获得编码该种酶基因的21条序列;在IPP和DMAPP形成GPP的过程中,牻牛儿基焦磷酸合酶(GPPS)是该催化反应的关键酶,GPP是合成单萜的前体物质,GPPS也是引入单萜生物合成的关键分支点酶(徐小博等,2018),本研究共筛选到13条序列与该基因有关;成环过程中的环烯醚萜合酶(IS)是环烯醚萜合成的关键酶,共筛选获得编码该基因的11条序列。上述序列的发掘说明栀子体内存在环烯醚萜类成分合成途径(表4),同时也为后续开展该途径解析提供了基础数据。

表3栀子药用成分相关的次生代谢产物生物合成途径

1.6 SSR分析

本研究利用MISA软件在栀子转录组的所有Unigene中共发现50 571个SSR位点,有5 671条Unigene存在混合型重复单元(表5)。可见,本研究构建的栀子转录组SSR种类丰富,均存在不同的重复类型,同时不同类型出现的频率也存在较大差异。以二、三核苷酸重复所占比例较高,分别占21.38%和15.16%;五、六核苷酸重复所占比例低,分别占0.40%和0.35%。在栀子所有被检出的SSR中,有100种重复基元出现,出现频率最高的3类基序为:AG/CT(6 391),C/G(2 441),AC/GT(2 384)。在三核苷酸重复基元中,AAG/CTT和AGG/CCT出现最多,分别为2 037个和1 532个。上述结果将为进一步筛选和开发栀子SSR标记、构建栀子遗传连锁图谱构建、辅助育种等研究提供基础数据。

图4 Unigene的KEGG分类


2、讨论


栀子是中国传统中药材,主要药效物质是环烯醚萜类、有机酸及黄酮类等,但关于其药用成分生物合成相关的基因报道较少。Ji等(2017)对不同成熟时期的栀子样品进行高通量转录组测序,通过基因注释、表达量及进化分析,共筛选并鉴定了6个西红花苷(Crocin)生物合成途径中的关键基因(ALDH12,ALDH14,UGT94U1,UGT86D1,UGT71H4,UGT85K18),这些基因的获得将为栀子中西红花苷生物合成的解析提供基础序列。中国药典中栀子的主要药效成分是环烯醚萜类物质栀子苷,但是目前对于栀子苷生物合成过程中的关键酶基因还未见研究。

图5植物中环烯醚萜类生物合成途径

本研究采用高通量测序技术对栀子药用部位栀子果实样品进行转录组测序,经过测序数据的组装和拼接共获得75 539条Unigene,平均序列长度1 614 bp,所有的Unigene都获得基因注释信息。同时借助上述结果开展环烯醚萜类成分生物合成途径中关键酶基因的挖掘与分析。环烯醚萜类物质具有多种药理活性,其合成途径是多种酶催化的复杂过程,一般将该过程分为合成前体、构建骨架以及后修饰三部分,先在萜类合酶的催化下形成基本骨架,再在后修饰酶的作用下进一步产生不同种类的萜类化合物。目前的研究主要集中在形成前体和骨架构建这两部分,编码相关催化酶的基因已经在地黄、当归、长春花、香樟等物种中克隆出来,而后修饰过程中涉及到的酶研究较少,在栀子物种中还未见报道。本研究借助于KEGG代谢通路分析,发现有223条Unigene富集在萜类骨架合成通路上(ko00900),单萜生物合成通路上(ko00902)有30条,35条富集在二萜生物合成通路上(ko00904)。本研究还筛选出6种共77条可能参与环烯醚萜类生物合成的相关酶基因,涉及到5-磷酸脱氧木酮糖合成酶(DXS)、5-磷酸脱氧木酮糖还原异构酶(DXR)、1-羟基-2-甲基-E-丁烯基4-焦磷酸还原酶(HDR)、香叶醇-10-脱氢酶基因(G10H)、牻牛儿基焦磷酸合酶(GPPS)、环烯醚萜合酶(IS)。这些结果为后续开展栀子内环烯醚萜类物质生物合成机理及相关酶的研究提供了基础序列,为后续开展栀子药效成分生物合成的分子机制提供依据。同时,栀子SSR位点的挖掘和分析也将为栀子SSR标记开发、遗传多样性、构建遗传连锁图并进行辅助育种提供基础数据。

表4栀子中环烯醚萜类生物合成途径中的候选基因

表5栀子SSR位点分析


3、 材料与方法


3.1样品采集与准备

栀子试验样品于2018年11月10日采集自重庆市(106觷42'1"E,29觷15'54"N),选取长势良好且相对一致的成年栀子植株3株,于栀子收获期分别取成熟果实,用纯水洗净果实,并用吸水纸吸干水分后按不同单株用锡纸包裹,立即放入液氮中保存以备提取样品总RNA。

3.2 RNA的提取与测序

本研究采用Trizol Reagent(Invitrogen)法提取各栀子样品总RNA,并将提取的RNA进行等量混合,分别使用生物分析仪(Agilen 2100)和分光光度计(NanoDrop)检测RNA质量,以保证符合建库质量要求。总RNA检测合格后,采用潘媛等(2018)的方法,将带有Oligo(dT)的磁珠对mRNA分离富集,使mRNA片段化,分为100~400 bp的短片段,以mRNA片段为模板,用逆转录试剂盒和随机引物合成第一链c D-NA,再合成并纯化双链DNA。纯化的DNA需进行末端修复及加A尾,利用AMPure XP beads选择片段大小,然后进行PCR扩增并纯化PCR产物,制备cDNA文库,并借助Illumina Hi SeqTM4000高通量测序平台进行转录组测序。

3.3序列筛选与组装

一般将上述测序过程下机所获得的序列称作原始序列(Raw reads),获得原始序列后首先要进行数据质量控制,去除里面低质量的序列,从而获得干净序列(Clean reads)。本研究采用Trinity软件(Grabherr et al.,2011)对干净序列(Clean reads)进行拼接,并通过序列之间的重叠(Overlap)信息组装得到重叠群(Contigs),之后组装得到转录本(Transcripts),转录本再通过TGICL和Phrap软件进行同源聚类和拼接,最终获得单基因簇(Unigene)(潘媛等,2018)。

3.4 Unigene功能注释和分类

本研究利用Nr(Altschul et al.,1997)(非冗余蛋白序列数据库)、Swiss-Prot(高质量非冗余蛋白序列数据库)、KEGG(Kanehisa et al.,2008)(京都基因与基因组百科全书)和KOG(真核生物蛋白相邻类的聚簇)等数据库进行相似性比对、GO分类和注释、KEGG代谢通路分析,进而获得所有Unigene的功能注释信息。

3.5 SSR分析

本研究获得的Unigene采用MISA软件进行SSR位点检索,以双核苷酸重复不少于6次,三到六核苷酸重复不少于4次为检索标准,复合型SSR中以双核苷酸为重复单位时,至少应含有2个SSR位点,且位点之间间隔碱基数不少于100 bp,最后利用软件统计分析SSR的种类和数量等信息。


参考文献:

[1]吴昕怡,刘小莉,2017,环烯醚萜类成分生物合成途径及关键酶基因研究进展,中国民族民间医药,26(8):44-48.

[2]徐小博,徐平,夏然,任敏,2018,地黄中环烯醚萜苷的生物合成研究进展,生物技术,28(5):508-512.


潘媛,陈大霞,李隆云.栀子环烯醚萜类物质生物合成相关基因的挖掘与分析[j].分子植物育种,2020,18(12):3923-3931.

基金:重庆市基本科研业务费(CSTC2018JXJL-JBKY130011);重庆市基础与前沿研究计划项目(CSTC2018JCYJax0553);国家中药材产业技术体系资助(cars-21);重庆市中药材产业技术体系(2018[5]号);重点产业共性关键技术创新专项资助(CSTC2016ZDCY-ZTZX10003)共同资助.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

现代园艺

期刊名称:现代园艺

期刊人气:2397

期刊详情

主管单位:江西省农业农村厅

主办单位:江西省经济作物局,江西省双金柑桔试验站

出版地方:江西

专业分类:农业

国际刊号:1006-4958

国内刊号:36-1287/S

邮发代号:44-114

创刊时间:1978年

发行周期:半月刊

期刊开本:大16开

见刊时间:7-9个月

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定