91学术服务平台

您好,欢迎来到91学术官网!站长邮箱:91xszz@sina.com

发布论文

论文咨询

探索10种植物对PSY基因密码子的使用偏好

  2020-06-15    466  上传者:管理员

摘要:选取10种植物PSY基因的CDS编码区序列,通过计算序列的碱基组成、有效密码子数(ENC)、同义密码子相对使用度(RSCU)等相关参数,并对这些序列进行ENC绘图与奇偶性分析,揭示10种植物对PSY基因密码子的使用偏好性。结果表明10种植物对于PSY基因密码子使用优先选择含有A和U末端密码子。ENC图显示除突变影响PSY基因密码子使用偏好性以外,还存在其他因素的影响。通过对RSCU值聚类分析发现,10种植物中含有UUG、AGA、AGG、GGA、GAU、ACA、GUU、CCU、GCU、UCU、UCA的密码子为最优密码子(RSCU值>1.6)。DANMAN结果显示GAAGATGC是10种植物所含有的最长的保守区域。以辣椒PSY基因为例,预测得到大肠杆菌和酿酒酵母是最合适的辣椒PSY基因的宿主。

  • 关键词:
  • ENC分析
  • PSY
  • 密码子偏好性
  • 聚类分析
  • 遗传学
  • 加入收藏

八氢番茄红素合成酶(PSY)是植物类胡萝卜素生物合成途径中的关键酶,对于番茄红素的合成具有重要作用,PSY基因表达量高低显著调控着植物类胡萝卜素的合成和积累[1],敲除番茄SlPSY1基因导致番茄中类胡萝卜素缺失[2],PSY基因在烟草[3]、玉米[4]和番茄中超表达提高了胡萝卜素含量和其他次级代谢物。PSY基因不仅限制了类胡萝卜素的生物合成,而且在非生物胁迫中也起到作用。比如脱落酸、茉莉酸甲酯和盐胁迫[5,6,7]。在香菜中,茉莉酸甲酯处理后导致PSY基因表达增强[8]。

所有的生物共用一整套密码子,密码子是信使核糖核酸上编码氨基酸的三联体核苷酸序列,编码同一个氨基酸的密码子称为同义密码子[9]。密码子在生物体遗传信息的传递过程中起着关键作用。研究发现,密码子的使用存在着不均等现象,即使是同一物种,其不同蛋白质中相同氨基酸对密码子的选用频率也不同,即密码子的使用具有偏好性[10]。密码子使用的偏差存在于广泛的生物系统中,包括原核生物和真核生物。影响密码子偏好性的因素有很多,如突变压力、自然选择、基因功能等。在多细胞真核生物中,如果蝇和秀丽隐杆线虫中密码子的偏好性主要取决于翻译效率[11,12]。在病毒中,如TTSuV1或细小病毒科主要通过突变压力和自然选择之间的相互作用确定同义密码子的使用模式[13,14,15]。在植物中,揭示拟南芥、水稻、玉米的密码子使用偏好性主要由基因组成,CDS长度和基因表达水平等因素决定[16]。研究表明谷子类甜蛋白家族基因密码子使用进化过程中主要受自然选择压力影响[17],而苋菜AmMYB2基因的密码子偏好性受突变压力的影响较大[9]。由于这种密码子使用偏好性的存在会导致外源基因密码子与宿主表达系统中密码子的使用频率差异显著,直接影响外源基因的表达与翻译,因此,研究密码子偏好性有助于为外源基因选择更优的表达系统,这对于提高基因的表达效率必不可少[18]。

密码子优化在增强异源系统中的蛋白质和DNA表达的过程中起着重要作用[19]。辣椒中含有丰富的类胡萝卜素[20],是研究植物类胡萝卜素化学和生物合成的重要植物,成熟的辣椒果实中含有α-胡萝卜素、β-胡萝卜素、玉米黄质、叶黄素、隐黄质、辣椒红素及辣椒玉红素等多种不同的类胡萝卜素,其种类和含量决定辣椒成熟果实的颜色,从而影响果实品质[21]。因此本研究以辣椒PSY基因为例,预测最合适PSY基因的宿主。借助生物信息学的分析方法,提取番茄、辣椒、烟草等10种植物PSY基因的CDS序列,计算其碱基组成、有效密码子数、同义密码子相对使用度等参数,以揭示10种植物对PSY基因密码子的使用偏好性。


1、材料与方法


1.1序列数据

10种植物PSY基因的全长编码区序列均来源于NCBI的GenBank数据库,登录号见表1。

表1PSY基因序列登录号

1.2相关密码子偏性分析指标

借助于CodonW1.4.4软件分析比较10种植物PSY基因密码子使用特性的参数,统计同义密码子第3位上的各个碱基含量(A3s、C3s、G3s和U3s)、密码子整体GC含量、编码同一氨基酸同义密码子第3位上的GC含量(GC3s),用于衡量碱基组成偏好程度。同时运用EMBOSS中的CUSP和CHIP在线程序计算10种植物PSY基因的有效密码子数用于评价基因整体密码子使用偏好性的程度。FOP值用于衡量最优密码子在同义密码子中的使用频率,其值在0.360~1.000,FOP值越大密码子使用频率越强[22]。密码子适应指数(CAI)用于估计高表达基因中首选密码子的倾向程度。CAI值介于0和1.0之间,密码子的CAI值越接近于1表示某基因中该密码子使用偏好性越强,表达水平较高[23]。

1.3密码子使用偏差分析

通过计算59个同义密码子的相对使用度(不包括Met、Trp和3个终止密码子),来衡量10种植物PSY密码子使用偏好性。RSCU值小于1.0时表示该密码子使用频率低;等于1.0时表示该密码子使用无差别;大于1.0时表示对该密码子具有强的使用性[24]。

1.4ENC绘图分析

ENC用于测量密码子偏倚于单个基因的程度。ENC的值从20(对于具有极端偏差的基因,仅使用一个每个氨基酸的密码子)至61(对于没有使用同义密码子的偏差的基因)。ENC绘图分析揭示ENC值和GC3s分布的关系,反映碱基组成对密码子偏好性的影响程度。

1.5奇偶偏好分析及保守性分析

基于PSY基因密码子第3位上的4种碱基含量,以A3/(A3+T3)值为纵坐标,G3/(G3+C3)值为横坐标绘图,以坐标(0.5,0.5)为中心,从该中心出发的矢量表示了奇偶偏好(parityrule2,PR2)的程度和方向。利用DNAMAN8软件对PSY基因的CDS序列进行保守性分析。

1.6数据统计

密码子参数的相关性系数采用SPSS18.0软件分析,使用MEGA5.0软件根据10个物种的CDS序列构建遗传进化树。使用TBtools对10种植物密码子的RSCU值进行物种间聚类。CaPSY基因的密码子频率是使用CUSP程序计算。拟南芥、酿酒酵母、烟草、大肠杆菌和玉米基因组的频率从密码子使用数据库获得。


2、结果与分析


2.110种植物PSY基因密码子基础组成

表2列出了10种植物的PSY基因编码区核苷酸序列中A3s、C3s、U3s、G3s、GC和GC3s的含量。GC含量为0.419~0.452。与A3s、U3s、C3s和G3s的值相比,10种植物对于PSY密码子使用优先选择A和U末端密码子。这表明U末端或A末端同义密码子优先用于PSY编码区。GC3s含量为0.342~0.409,FOP含量为0.312~0.424。其中拟南芥、胡萝卜和番木瓜的FOP值偏离0.360程度高,表明这3种植物对PSY基因密码子的使用偏好性更强。CAI值为0.145~0.184,其中拟南芥CAI与FOP的预测值为0.184与0.424,表明拟南芥对PSY基因密码子的使用偏好性强于其他9种植物。

表210种植物中PSY基因密码子使用参数

2.2ENC绘图与奇偶性分析

图1-a显示10种植物中PSY基因的ENC与GC3s的分布图。通过计算ENC值与GC3s两个参数之间的相关性,可以检验突变压力对PSY基因密码子偏好性的影响程度。PSY基因序列的ENC值从46.93波动到52.57,平均值为50.43。从ENC对GC3s的分布图中可以看出10个物种中的PSY基因均低于该曲线,但PSY基因分布范围不大,表明PSY基因密码子偏好性现象不仅仅受突变压力的影响,且10种植物PSY基因受突变压力影响程度相近。奇偶性结果显示(图1-b),AtPSY、FaPSY、CmPSY、DcPSY、ClPSY、CkPSY位于y轴0.5以上,矢量向上及左侧(大多数偏左),2个方向偏倚,说明这6种植物基因密码子第3位A和T的含量较高,LcPSY、CaPSY、NtPSY、SIPSY的G3/G3+C3位于x轴0.5右侧,说明该基因密码子第3位碱基G的使用频率大于C碱基。若PSY基因密码子的偏好性的形成完全受突变压力影响,则嘌呤碱基的使用频率与嘧啶碱基的使用频率应该相等,即A碱基与T碱基,G碱基与C碱基的使用频率相等。这说明突变压力与自然选择都会影响这10种植物PSY基因的密码子偏好性。

2.310种植物PSY基因RSCU值分析

为了研究PSY基因的密码子使用模式,理解10种植物PSY基因的密码子偏好性使用差异,使用TBtools构建了不同物种PSY基因RSCU的层次聚类分析(图2)。结果表明,有几个同义密码子在物种间保持密码子使用的显著差异。不同物种中对于UUG、AGA、AGG、GGA、GAU、ACA、GUU、CCU、GCU、UCU、UCA的偏好性超过其他密码子。

2.4PSY基因密码子偏好性的聚类分析

基于PSY基因的RSCU值的聚类树(图3)。显示出基于PSY基因CDS区序列而构建的系统发育树不相同的结果(图4),例如,DcPSY与FaPSY在系统发育树中位于同一族,而在聚类数中,CkPSY与FaPSY在一个组中。表明10种植物PSY基因密码子使用模式存在一定差异。利用DNAMAN软件对10种植物PSY基因的CDS区进行多序列比对来分析其序列保守性(图5),在902~1010bp发现1个具有较多碱基的序列保守区(图5红方框内序列),利用此位置的序列设计引物,有利于准确的克隆PSY基因。

图110种植物的PSY基因的同义第3密码子位置(GC3s)与有效密码子数(ENC)含量的分布及奇偶性分析

图2PSY基因的同义密码子相对使用度(RSCU)的分层聚类分析

图3用于PSY基因的RSCU的聚类树

图4由PSY基因编码的CDS序列的系统发育树

图510种植物的PSY基因编码区序列的联配(部分展示)

2.5辣椒PSY基因的合适表达宿主的确定

为了选择PSY基因的合适表达宿主,以辣椒PSY基因密码子为代表,计算密码子使用频率与多个物种基因组之间的关系(表3)。结果表明,辣椒PSY基因在大肠杆菌(Escherichiacoli)和酿酒酵母(Saccharomycescerevisiae)中的使用频率高于其他物种,表明大肠杆菌和酿酒酵母是最合适PSY基因的宿主。


3、结论与讨论


研究发现有许多因素影响植物对PSY基因密码子的偏好性使用,可能涉及的有基因表达水平、自然选择、基因长度或GC的组成成分等[25,26]。本研究通过分析10种植物对PSY基因的密码子使用,发现10种植物对于PSY基因密码子优先选择含有A和U末端密码子。定向突变压力和自然选择是决定密码子偏好性的两个主要因素[27]。密码子适应指数(CAI)用于估计高表达基因中首选密码子的倾向程度。CAI值介于0和1.0之间,较高的值可能表示密码子使用偏好性更强,表达水平更高。本研究中发现拟南芥的CAI值比其他植物更高,预测拟南芥对PSY基因密码子的使用偏好性更强,但通过对10种植物PSY基因RSCU值分析,当以RSCU值>1.6为标准时,发现烟草对PSY基因密码子的使用偏好性强于拟南芥。前人研究发现,在高表达基因中,密码子适应指数与密码子使用偏好性具有密切联系,而在低表达基因中,突变决定密码子使用的偏好性[28,29,30]。研究发现所有PSY基因都具有低表达水平,表明植物对PSY基因密码子的使用偏好性可能与突变有关[31]。

ENC与GC3s的绘图分析已被广泛用于研究各种物种间基因的密码子使用[32,33,34,35]。本研究发现10种植物中的PSY基因ENC值均低于标准曲线,但PSY基因分布范围不大,表明PSY基因密码子偏好性现象不仅仅受突变压力的影响。奇偶性结果显示,大部分点位于y轴0.5以上,矢量向上及左侧(大多数偏左)两个方向偏倚,结果显示10种植物基因密码子第3位A和T的含量较高,表明密码子使用偏性现象不仅仅由突变压力引起,还受其他因素的影响。基于PSY基因密码子的RSCU值的聚类树PSY基因的CDS区序列而构建的系统发育树不相同的结果,表明10种植物PSY基因密码子使用偏好性存在一定的差异。利用DNAMAN软件对10种植物的PSY基因的CDS进行了序列联配,在902~1010bp处发现1个具有较多碱基的序列保守区,利用此位置的序列设计引物,有利于准确的克隆PSY基因。

表3辣椒PSY基因密码子使用频率与多个物种基因组之间的关系

基因的表达效率与受体系统密码子使用偏好性息息相关。根据受体生物密码子使用偏好性,对目标基因进行序列改造和修饰,是提高表达效率的有效途径之一[36]。辣椒是一种重要的蔬菜作物,在世界各地广泛栽培,同时辣椒中含有丰富的类胡萝卜素[20]。类胡萝卜素含量和成分的不同影响果实的品质进而影响商品价值;类胡萝卜素作为抗氧化剂,对人类癌症和心血管疾病预防能起到一定作用。PSY基因作为类胡萝卜素合成的关键酶基因,了解辣椒PSY基因密码子的使用偏好性并选择合适的表达宿主显得尤为重要,本研究以辣椒为例,计算密码子使用频率与多个物种基因组之间的关系。结果表明,辣椒PSY基因在大肠杆菌(E.coli)和酿酒酵母(S.cerevisiae)中的使用频率高于其他物种,表明大肠杆菌和酿酒酵母是最合适PSY基因的宿主。


参考文献:

[9]彭丽云,王云,孙雪丽,等.苋菜AmMYB2基因密码子偏好性与进化分析[J].应用与环境生物学报,2019,25(3):679-686.

[10]王云,彭丽云,苏立遥,等.龙眼Hsf基因家族密码子使用模式分析[J].分子植物育种,2019,17(17):5595-5603.

[17]刘潮,韩利红,王海波,等.谷子类甜蛋白基因家族的鉴定与密码子偏性分析[J].西北农业学报,2018,27(1):52-61.

[18]李凌烜,陈安琪,黄凯,等.豆科植物dxr基因密码子偏好性分析[J/OL].生物学杂志,2019-11-06.

[20]李大伟,郝万江,巩振辉,等.辣椒果色遗传与分子生物学研究进展[J].辣椒杂志,2014(2):1-5.

[21]李全辉,邵登魁,李江,等.辣椒果实类胡萝卜素生物合成研究进展[J].植物遗传资源学报,2019,20(2):5-14.

[24]冯海悦,张羽,吴正常,等.13种哺乳动物MUC4基因密码子使用模式分析[J].农业生物技术学报,2018,26(9):1546-1556.

[31]赖瑞联,冯新,高敏霞,等.美味猕猴桃过氧化物酶基因AdPOD27的密码子偏好特征分析[J].热带作物学报,2018,39(7):1344-1350.

[32]戴开宇,黄焱杰,吴丽思,等.猪2基因密码子使用偏好性分析及优化[J].中国畜牧兽医,2018,45(7):1863-1872.

[33]郝豆豆,张勇群,雷鸣,等.10种藏药材ccmFN基因片段密码子偏好性分析[J].中成药,2018,40(7):1551-1557.

[34]苏少锋,赵一萍,白东义,等.马转录因子TBX3基因的密码子使用偏好性分析[J].中国农业大学学报,2018,23(7):53-65.

[35]晁岳恩,吴政卿,杨会民,等.11种植物psbA基因的密码子偏好性及聚类分析[J].核农学报,2011,25(5):927-932.


李慧姬,吉雪花,朱冉冉,张中荣,张海英,吕慧.10种植物PSY基因密码子使用偏好性分析[J].西北农业学报,2020,29(02):276-284.

基金:国家自然科学基金(31860548);石河子大学育种专项(kx0301).

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

生物多样性

期刊名称:生物多样性

期刊人气:1935

期刊详情

主管单位:中国科学院

主办单位:中国科学院生物多样性委员会,中国植物学会,中国科学院植物研究所,中国科学院动物研究所,中国科学院微生物研究所

出版地方:北京

专业分类:生物

国际刊号:1005-0094

国内刊号:11-3247/Q

邮发代号:82-858

创刊时间:1993年

发行周期:月刊

期刊开本:大16开

见刊时间:一年半以上

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定