摘要:目的:获得牛蒡Arctiumlappa根功能基因数据库,分析其木质素类化合物生物合成途径及关键酶基因。方法:以牛蒡根为研究对象,利用华大基因BGISEQ-500测序平台进行转录组测序,通过从头组装获得Unigene,利用各种已有的核酸和蛋白质数据库对Unigene进行注释和分类,利用KEGG代谢途径分析木质素生物合成途径及其关键酶基因,利用三维同源建模分析苯丙氨酸解氨酶(AlPAL)的结构特点。结果:通过转录组测序共获得54215个Unigene,其中42003个Unigene被任一数据库注释,1668个Unigene被注释到54个转录因子家族中;KEGG途径分析鉴定了423个Unigene参与了木质素的生物合成。AlPAL空间结构模型显示其为同型四聚体,每个单体由3个结构域组成,包括4-甲基-咪唑-5-酮(MIO)结构域、核心结构域和屏蔽结构域,其中MIO结构域包含保守的三肽ASG,构成AlPAL酶的催化活性中心。结论:对牛蒡根转录组进行分析,为牛蒡功能基因鉴定、次生代谢途径解析及其调控机制研究奠定了实验基础。
牛蒡ArctiumlappaL.是传统药用植物[1,2],为菊科牛蒡属植物,又被称为大力子、东洋参等,其根可入药,具有风热疏导、解毒消肿的作用,常用于治疗感冒、喉咙不适以及疮疡肿毒等疾病[3]。牛蒡含木质素、挥发油及少量的生物碱等化学成分[4],其中木质素类化合物是牛蒡的重要药用成分,其具有多种药理活性,主要包括抗肿瘤[5]、抗菌[6]、对心血管及中枢神经系统的抑制作用等[7,8]。
木质素是由苯丙烷单体脱氢聚合而成,苯丙烷首先经历苯丙氨酸、酪氨酸、色氨酸等芳香族氨基酸的莽草酸途径,然后经过脱氨基、甲基化、羟基活化等过程生成羟基肉桂酸(HCA)类化合物及羟基肉桂酸酯酰辅酶A(HCA-CoA)类化合物;它们进一步被氧化还原为木质素单体,再强化脱氢聚合生成木质素[9]。牛蒡的苯丙氨酸解氨酶(AlPAL)是调控木质素合成的首个关键酶,能够催化苯丙氨酸脱氨生成肉桂酸,大量研究表明PAL活性与木质素、花青素、黄酮等的积累呈显著正相关,说明其在调节次级代谢产物的生成、维持植物正常生长发育及提高植物抗逆能力方面发挥着重要作用[10,11,12,13]。
近年来,象草PennisetumpurpureumSchum.[14]、慈竹笋NeosinocalamusaffinisL.[15]等多种植物被陆续进行了转录组测序,象草和慈竹笋中木质素类物质生物合成途径及关键酶也得到了分析。而牛蒡转录组信息的研究目前尚未被报道,这也阻碍了对牛蒡木质素类合成途径的研究。本研究利用华大基因BGISEQ-500测序平台构建牛蒡根转录组数据库,获取了转录本信息,通过分析功能基因,挖掘木质素生物合成关键酶,为进一步揭示牛蒡木质素的生物合成路径及调控机制、关键酶基因功能研究等奠定了基础。
1、材料
牛蒡根样品采摘于山东省临沂市兰陵县牛蒡种植基地,经安徽中医药大学杨青山教授鉴定为菊科牛蒡属植物牛蒡ArctiumlappaL.。将新鲜的牛蒡根用超纯水洗净,然后用滤纸吸干其水分,放入液氮中储存,保存于-80℃冰箱备用。
2、方法
2.1 RNA提取和测序
用OmegaBio-TekRNA试剂盒提取牛蒡根组织的总RNA,并利用NanoDrop和Agilent2100检测其纯度、浓度和完整性,用带有Oligo(dT)的磁珠富集mRNA并进行片段化处理。以片断mRNA为模版合成一链cDNA以及二链cDNA,最终获得cDNA文库。利用华大基因BGISEQ-500测序平台对完整cDNA文库进行测序。
2.2 序列拼接和组装
转录组测序后,获得原始读段(rawreads),通过数据过滤获得高质量读段(cleanreads)。利用Trinity软件重新组装获取转录本序列,然后使用TGICL软件对转录本进行聚类去冗余,以获得Unigene。
2.3 Unigene功能注释和分类
利用BLASTX对获得的Unigene进行NR(NCBI非冗余蛋白质数据库)、SwissProt(蛋白质序列数据库)、KEGG(京都基因与基因组百科全书)、KOG(蛋白直系同源数据库)、NT(非冗余核苷酸数据库)注释,根据NR注释信息,使用Blast2GO得到UnigeneGO(基因本体数据库)注释,最后将Unigene进行Pfam(多序列比对和隐马尔科夫模型构建的蛋白家族数据)注释。
2.4 结构特征分析
利用ORFFinder(OpenReadingFrameFinder)工具寻找AlPAL基因完整的开放读码框(ORF),使用DNAMAN软件对AlPAL氨基酸序列进行同源比对,寻找其保守的活性位点;使用SWISS-MODEL软件(https://swissmodel.expasy.org/)进行三维同源建模,利用PyMOL软件构建PAL的三级结构,并对其三级结构进行分析。
2.5 转录因子的鉴定分析
通过对编码转录因子(TF)的基因进行预测,再对基因所属的转录因子家族进行分类统计,然后使用ORFFinder工具确定这些Unigene编码的蛋白序列,将编码蛋白序列与植物转录因子数据库plantTFDB进行hmmscan比对,得到Unigene对应的TF家族,同时获得TF更多的关于功能、结合位点等蛋白信息。
3、结果与分析
3.1 牛蒡转录组的测序和组装
通过对牛蒡根进行转录组测序,获得了11531万条原始读段,过滤后得到了11094万条高质量读段,最终组装获得54215个Unigene,平均长度为1271bp,GC含量为41.40%,Q30值为90.51%。其中长度1000~3000bp的Unigene有22786个,长度超过3000bp的Unigene有3806个(图1)。
图1Unigene的长度分布
3.2 Unigene的功能注释
3.2.1 序列比对及功能注释
将42003个Unigene注释到各种功能数据库,其中NR数据库注释率最高(40490Unigenes),占74.68%;其次是NT、KEGG、KOG数据库,分别注释了32975(60.82%)、31619(58.32%)、31546(58.19%)个Unigenes,而GO数据库注释Unigene最少,为12677个,仅占23.38%(图2-A)。NR数据库注释基因同源物种分布如图2-B所示,注释到刺菜蓟Cynaracardunculusvar.scolymusL.的Unigene最多,占61.68%;其次是向日葵HelianthusannuusL.,占29.03%。
3.2.2 Unigene的GO分析
利用Blast2GO在线软件将所有已比对到NR数据库的Unigene进行GO功能注释,结果显示共有12677个Unigenes被注释,注释率为23.38%。这些Unigenes被分为3大类即生物过程、细胞组成、分子功能(图3)。其中生物过程主要集中在细胞过程(cellularprocess,3817个Unigenes);细胞组成主要集中于细胞(cell,3876个Unigenes)、膜部分(membranepart,3592个Unigenes)和细胞器部分(organellepart,1523个Unigenes);分子功能主要集中于结合功能(binding,6253个Unigenes)和催化活性(catalyticactivity,5878个Unigenes)。
图2Unigene的功能注释
A-5个不同数据库的Unigene注释韦恩图B-牛蒡的NR数据库物种注释分布
3.2.3 Unigene的KOG分类
将组装获得的Unigene注释到KOG数据库中,共有31619个Unigenes被注释到25种KOG分类中,其中“一般功能”“信号转导机制”是其中最大的2类,分别有6602、3900个Unigenes;Unigene在细胞运动(cellmotility)类别中分布最少,仅有3个(图4)。
3.2.4 Unigene的KEGG分析
利用KEGG数据库对牛蒡参与代谢途径的Unigene进行注释,结果有31546个Unigene注释到5大类群中,参与了134条代谢途径。其中细胞过程(cellularprocesses)主要集中在运输和分解代谢(transportandcatabolism,1459个);环境信息处理(environmentalinformationprocessing)主要集中在信号传导(signaltransduction,1774个);遗传信息处理(geneticinformationprocessing)主要集中在翻译(translation,2202个)和折叠、分类和降解(folding,sortinganddegradation,2018个);代谢(metabolism)主要集中在碳水化合物代谢(metabolism,2680个)和氨基酸代谢(environmentaladaptation,1383个);有机系统(organismalsystems)主要集中在环境适应(environmentaladaptation,1160个)(图5)。
图3Unigene的GO功能分类
图4Unigene的KOG功能分类
在牛蒡根的转录组数据中,共有1002个Unigenes基因定位于14个其他次生代谢产物合成相关的途径,其中423个Unigenes被定位于苯丙素生物合成途径(Ko00940);其次是有97个Unigenes被定位于类黄酮生物合成途径(Ko00941);定位于花青素生物合成途径(Ko00942)的Unigenes最少,仅有10个(图6)。
3.3 木质素类物质生物合成相关基因分析
在牛蒡木质素合成(图7)中,苯丙氨酸经由苯丙酸途径,通过一系列的脱氨基、羟基化与甲基化等反应,合成羟基肉桂酸类化合物,包括对-香豆酸(p-coumaricacid)、咖啡酸(caffeicacid)与阿魏酸(ferulicacid);羟基肉桂酸经4-香豆酸辅酶A连接酶(4CL)催化合成羟基肉桂酸酯酰辅酶A类化合物,然后进入木质素特异的合成反应中,经肉桂酰辅酶A还原酶(CCR)与肉桂醇脱氢酶(CAD)2步还原反应生成甲基化程度不同的木质素单体;木质素单体在过氧化物酶(POX)的作用下进一步氧化聚合,生成3种主要的木质素类型:对-羟基苯基木质素(H-木质素)、愈创木基木质素(G-木质素)和紫丁香基木质素(S-木质素)。共发现423个Unigenes参与木质素的代谢通路,有63个Unigenes编码木质素合成途径中7种关键酶,包括PAL、COMT、4CL、CCR、CAD、POX和F5H,其中编码F5H的基因最多,有18个;编码POX的基因其次,有15个;而编码COMT、PAL、4CL的基因分别有6、5、5个(表1)。
图5Unigene的KEGG功能分类
图6牛蒡根其他次生代谢物生物合成途径分类
图7牛蒡根中木质素生物合成途径
绿色代表表达水平较低的基因,红色代表表达水平较高的基因
表1木质素类物质生物合成关键酶基因
3.4 AlPAL的结构特征分析
在牛蒡根转录组数据库中发掘了5个完整的AlPAL基因,它们的氨基酸序列一致性高达96.08%。本课题组选择具完整读码框的表达量最高的CL3641.Contig4基因为研究对象,利用SWISS-MODLE和PyMol软件,以欧芹PetroselinumcrispumNym.中的PAL晶体结构(PDBID:1w27)[16]为模板构建了AlPAL的三级结构模型。AlPAL空间结构是一个“橄榄球状”的同型四聚体(图8-A),每个AlPAL单体含有3个结构域,分别为MIO结构域(W25-A261,图8-B绿色螺旋显示)、核心结构域(V262-E527和Z650-I716,图8-B黄色螺旋显示)和屏蔽结构域(E528-R649,图8-B青色螺旋显示)。其中,MIO结构域包含PAL酶家族保守序列(GTITASGDLVPLSYIAG)(图8-C,绿色方框显示)和酶的活性中(Ala-Ser-Gly,即ASG)(图8-B,红色球形显示;图8-C,红色方框显示)。
图8AlPAL氨基酸序列比对及蛋白空间结构模型
A-AlPAL同型四聚体B-AlPAL单体C-5个AlPAL基因的氨基酸序列比对(红色框出的是PAL酶的活性中心“ASG”)
3.5 AlPAL的同源性及系统进化关系分析
利用MEGA5.0软件对GenBank数据库中不同植物的PAL氨基酸序列进行比对分析得到AlPAL系统发育进化树(图9)。AlPAL与刺菜蓟Cynaracardunculusvar.scolymus的遗传距离最短,亲源关系最近,这与刺菜蓟与牛蒡都属于菊科菜蓟族是一致的。
图9PAL的系统发育进化树
3.6 与木质素生物合成及其他次生代谢相关的转录因子
转录因子(transcriptionfactor,TF)被证明可以调控各种次生代谢途径。在牛蒡根转录组数据库中,1668个Unigenes被注释为TF,共分为54个TF家族。其中Unigene数目最多的是MYB家族(212个Unigenes),其次是AP2-EREBP家族(135个Unigenes)和bHLH家族(122个Unigenes,图10)。
对1668个TF进行代谢途径富集,鉴定了9个参与木质素生物合成途径的Unigenes,包括5个属于MYB家族的Unigenes,调控过氧化物酶(POX);3个属于NAC家族的Unigenes,调控肉桂酰辅酶A还原酶(CCR);1个属于HRT家族的Unigene,调控肉桂醇脱氢酶(CAD),见表2。
4、讨论
牛蒡是一种常见的药食同源的传统中药材,木质素类化合物作为牛蒡的主要活性成分,常用于治疗风热感冒、咳嗽多痰、麻疹等症,但目前对牛蒡中木质素类物质的生物合成及其调控机制尚未有深入研究。本研究首次利用华大基因BGISEQ-500平台对牛蒡根样品进行转录组测序,通过从头组装后获得了54215个Unigenes,平均长度为1271bp;通过功能基因分析进一步挖掘了牛蒡木质素类物质生物合成的关键基因。
将获得的Unigenes与NR、KEGG、GO等7大数据库进行比对,有42003个Unigenes获得功能注释,注释率为77.47%,这与已报道的艾草[17]、黄三七[18]、白鲜[19]等药用植物转录组注释比例相似。因为缺乏基因组信息,12212个Unigenes未获得注释,故牛蒡根转录组尚存在22.53%功能未知的Unigenes。
图10转录因子家族分类
表2木质素类物质生物合成相关转录因子
在牛蒡根木质素合成途径中,63个功能基因编码7种关键酶,其中AlPAL是调控木质素合成的首个关键酶,能够催化苯丙氨酸脱氨生成肉桂酸。在牛蒡根中编码AlPAL的CL3641.Contig4基因表达量最高,且具有完整的读码框,本课题组对其三级结构进行同源建模,AlPAL的空间结构是一个“橄榄球状”的同型四聚体,每个单体包含3个结构域,其中,MIO结构域含有PAL酶家族保守序列和三肽活性中心“ASG”。Ala-Ser-Gly三肽经环化脱水形成亲电基团,通过攻击芳香环增加亲电性,从而发挥酶辅助因子的作用,增强PAL酶的活性[20,21]。Aterola等[22]研究发现,抑制PAL表达会导致转基因烟草中木质素含量降低,并伴随着丁香木质素/愈创木基木质素(S/G)比值的增加,严重影响其生长发育,推测AlPAL很可能在调控牛蒡根木质素合成过程中也同样发挥着重要调控作用。
牛蒡根中共有1668个Unigenes注释到54个转录因子家族,包括MYB、NAC、HRT、AP2-EREBP等,其中注释到MYB家族的Unigene数目最多,有212个。Blanca等[23]研究发现海岸松中MYB8转录因子能激活PAL的表达,使得木质素含量提高。因此本课题组推测在牛蒡木质素类物质生物合成过程中MYB类转录因子可能对木质素类物质生物合成的关键酶也发挥着重要的调控作用。
本研究首次对牛蒡根进行了转录组测序,构建了牛蒡根转录组数据库,为牛蒡木质素类物质生物合成途径的解析和关键酶功能研究奠定了基础。
参考文献:
[1]武世豪,杜金行,努尔比亚·阿布拉,等.牛蒡药理作用研究进展[J].中华中医药杂志,2017,32(7):3093-3095.
[2]曹剑锋.牛蒡根其化学成分的药理活性研究[D].济南:山东大学,2012.
[3]郑云枫,彭国平.牛蒡的化学研究进展[J].时珍国医国药,2005,16(2):153-155.
[4]蒋淑敏.牛蒡化学成分和药理作用的研究现状[J].时珍国医国药,2001,12(10):941-942.
[5]崔银雪.木脂素对MCF-7乳腺癌细胞抗增殖作用及其机制的研究[D].延吉:延边大学,2010.
[6]冯亚净,媛媛,王瑞鑫,等.五味子木脂素对大肠杆菌的抑菌机理及效果[J].食品与发酵工业,2016,42(2):72-76.
[7]惠永正.中药天然产物大全[M].上海:上海科学技术出版社,2011.
[8]王国丽,祝洪艳,郜玉钢,等.五味子木脂素对中枢神经系统作用的研究进展[J].上海中医药杂志,2014,48(11):99-101.
[9]丁霄,曹彩荣,李朋波,等.植物木质素的合成与调控研究进展[J].山西农业科学,2016,44(9):1406-1411.
[10]胡晓立,杨建民,陈东亮,等.NaCl胁迫对紫叶李叶片色泽的影响[J].林业科学,2010,46(12):64-69.
[11]李云飞,李彦慧,王中华,等.土壤干旱胁迫对紫叶矮樱叶片呈色的影响[J].生态学报,2009,29(7):3678-3684.
[12]刘佳,徐秉良,薛应钰,等.美洲南瓜(Cucurbitapepo)种皮苯丙氨酸解氨酶基因克隆与表达分析[J].中国农业科学,2014,47(6):1216-1226.
[13]ThomasV.PhenylpropanoidBiosynthesis[J].MolecularPlant,2010,3(1):2-20.
[14]吴娟子,钱晨,刘智微,等.基于转录组测序分析象草木质素合成的研究[J].草业学报,2019,28(1):150-161.
[15]蒋海港,王树刚,刘阳,等.基于转录组测序的慈竹笋木质素基因筛选及其表达分析[J].植物研究,2018,38(3):415-421.
[18]李依民,彭亮,杨冰月,等.基于高通量测序技术的黄三七根茎转录组数据分析[J].中草药,2018,49(21):38-45.
[19]李依民,张化为,陈莹,等.白鲜根转录组高通量测序与数据分析[J].中草药,2018,49(21):30-37.
魏俊雯,张声祥,施圆圆,单春苗,马克龙,吴家文.基于转录组测序的牛蒡木质素类物质生物合成途径及关键酶基因分析[J].中草药,2020,51(16):4300-4307.
基金:安徽省高校自然科学研究重大项目(KJ2018ZD028)及重点项目(KJ2019A0476);安徽省高校优秀青年人才支持计划项目(gxyq2019030);安徽省自然科学基金项目(1408085QH182);国家级大学生创新创业训练计划项目(201810369050,201910369029);名贵中药资源可持续利用能力建设项目(2060302).
分享:
少数民族药物红葱(Eleutherine americana)又被称为小红蒜、百步还阳、怕波亮,是鸢尾科红葱属植物。红葱是外来引入的物种,原生长于美洲和西印度群岛等地区,在我国云南、甘肃、陕西、宁夏、河北等地均有栽培[1]。红葱虽然是引进物种,但我国对其应用开发也有相当悠长的历史。
2024-04-23癫痫是神经系统的常见慢性疾病之一。流行病学研究表明,全球至少有7 000万癫痫患者。随着现代生物-心理-社会医学模式的转变,癫痫共患病受到了广泛关注,2017年国际抗癫痫联盟发布的癫痫发作分类及诊断流程中也强调癫痫的诊断需考虑到共患病因素,认知功能障碍是常见的癫痫共患病。
2024-04-22细菌感染每年导致全球800多万人死亡,占所有报告的与感染有关的死亡人数的50%以上。在得到准确的药敏结果前,30%~50%的细菌感染患者接受的一线抗菌药物治疗无效,而且每延迟1 h给予正确的抗菌药物治疗,患者的存活率就会下降10%。基于光学、电阻抗、微流控、质谱及拉曼光谱等原理的技术,这些技术主要是基于细菌生长或代谢表型的药敏检测。
2024-03-01五倍子,享有中国五倍子的声誉,是瘿绵蚜科蚜虫寄生在盐肤木、青麸杨等寄主植物的树叶或叶柄上形成的虫瘿。我国五倍子年产量1.2~1.3万吨,占世界总产量95%以上,是我国的特色农林资源。因五倍子收敛、止血,为我国传统中药材,而其提取物单宁酸及其加工衍生物没食子酸丙酯则为常用食品添加剂。
2024-02-24天冬Asparagi Radix为百合科植物天冬Asparagus cochinchinensis(Lour.)Merr.的干燥块根,《神农本草经》中将其列为上品,主要分布在广西、四川、贵州、云南等省区。2020年版《中国药典》中记载,其药性甘、苦,寒,具有养阴润燥、清肺生津等功效,在临床上广泛用于治疗肺燥干咳、顿咳痰黏、咽干口渴、肠燥便秘等症状。
2024-02-19系统性硬化症(systemic sclerosis, SSc),又称为硬皮病,是一种免疫介导的结缔组织病,以皮肤和内脏器官纤维化以及血管病变为特征。SSc发病率不高,但其死亡率高于其他风湿性疾病。肺部受累是SSc的早期并发症,也是SSc患者的主要死亡原因。约80%的SSc患者有肺间质异常甚至肺纤维化,最终30%的SSc患者会发展为间质性肺病(interstitial lung disease, ILD)。
2024-01-31现有研究表明中药材的某些显微特征常数还与其有效成分有相关性[6,7,8]。与叶表皮组织有关的显微常数主要包括表皮细胞形态、垂周壁类型、气孔轴式、气孔密度、气孔指数、脉岛数和栅表比等,这些指标在同种植物中相对稳定,常被用来鉴定常见叶类药材的混淆品和伪品[9,10],同时,这些形态特征具有较高的分类学和系统学的价值,也是探讨药用植物亲缘关系的主要特征。
2021-12-04地黄为玄参科多年生草本植物地黄RehmanniaglutinosaLibosch的新鲜或干燥块根[1]。《神农本草经》称地黄为“久服,轻身、不老”的上品,其中生地黄具有清热凉血、养阴生津的作用;熟地黄具有滋阴补血、益精填髓的作用[1]。生地黄和熟地黄均被中国国家卫生部列为可用于保健食品的名单。现代药理学研究表明,地黄叶中含有与地黄根中相似的化学成分[2,3]。
2021-12-04正心降脂片由羊红膻、决明子、何首乌、黄芪、葛根、槐米、陈皮、丹参等8味中药组成,主要用于临床治疗冠心病患者气虚血瘀、痰浊蕴结所致的胸痹、心痛、头痛、眩晕等,现收录于2020年版《中国药典》(一部)[1]。葛根中的主要药效成分葛根素、3′-甲氧基葛根素和大豆苷为异黄酮类成分,具有降血压、降血脂、降血糖等多种药理作用。
2021-12-01罂粟壳,别名米壳、御米壳、粟壳、烟斗斗、烟果果、罂子粟壳等,为罂粟科植物罂粟PapaversomniferumL.的干燥果壳,即于秋季将成熟果实或已割取浆汁后的成熟果实摘下、破开、除去种子和枝梗后所得的干燥果壳,具有敛肺、涩肠、止痛的功效,可用于治疗久咳、久泄、脱肛、脘腹疼痛等症[1],是国家麻醉药品目录中收录的唯一的中药饮片。
2021-12-01人气:14209
人气:13386
人气:12986
人气:11804
人气:11550
我要评论
期刊名称:中国药物化学杂志
期刊人气:1808
主管单位:辽宁省教育厅
主办单位:沈阳药科大学,中国药学会
出版地方:辽宁
专业分类:医学
国际刊号:1005-0108
国内刊号:21-1313/R
邮发代号:8-101
创刊时间:1990年
发行周期:双月刊
期刊开本:大16开
见刊时间:一年半以上
影响因子:1.392
影响因子:0.709
影响因子:1.360
影响因子:0.840
影响因子:1.980
400-069-1609
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!