摘要:选取10种植物PSY基因的CDS编码区序列,通过计算序列的碱基组成、有效密码子数(ENC)、同义密码子相对使用度(RSCU)等相关参数,并对这些序列进行ENC绘图与奇偶性分析,揭示10种植物对PSY基因密码子的使用偏好性。结果表明10种植物对于PSY基因密码子使用优先选择含有A和U末端密码子。ENC图显示除突变影响PSY基因密码子使用偏好性以外,还存在其他因素的影响。通过对RSCU值聚类分析发现,10种植物中含有UUG、AGA、AGG、GGA、GAU、ACA、GUU、CCU、GCU、UCU、UCA的密码子为最优密码子(RSCU值>1.6)。DANMAN结果显示GAAGATGC是10种植物所含有的最长的保守区域。以辣椒PSY基因为例,预测得到大肠杆菌和酿酒酵母是最合适的辣椒PSY基因的宿主。
加入收藏
八氢番茄红素合成酶(PSY)是植物类胡萝卜素生物合成途径中的关键酶,对于番茄红素的合成具有重要作用,PSY基因表达量高低显著调控着植物类胡萝卜素的合成和积累[1],敲除番茄SlPSY1基因导致番茄中类胡萝卜素缺失[2],PSY基因在烟草[3]、玉米[4]和番茄中超表达提高了胡萝卜素含量和其他次级代谢物。PSY基因不仅限制了类胡萝卜素的生物合成,而且在非生物胁迫中也起到作用。比如脱落酸、茉莉酸甲酯和盐胁迫[5,6,7]。在香菜中,茉莉酸甲酯处理后导致PSY基因表达增强[8]。
所有的生物共用一整套密码子,密码子是信使核糖核酸上编码氨基酸的三联体核苷酸序列,编码同一个氨基酸的密码子称为同义密码子[9]。密码子在生物体遗传信息的传递过程中起着关键作用。研究发现,密码子的使用存在着不均等现象,即使是同一物种,其不同蛋白质中相同氨基酸对密码子的选用频率也不同,即密码子的使用具有偏好性[10]。密码子使用的偏差存在于广泛的生物系统中,包括原核生物和真核生物。影响密码子偏好性的因素有很多,如突变压力、自然选择、基因功能等。在多细胞真核生物中,如果蝇和秀丽隐杆线虫中密码子的偏好性主要取决于翻译效率[11,12]。在病毒中,如TTSuV1或细小病毒科主要通过突变压力和自然选择之间的相互作用确定同义密码子的使用模式[13,14,15]。在植物中,揭示拟南芥、水稻、玉米的密码子使用偏好性主要由基因组成,CDS长度和基因表达水平等因素决定[16]。研究表明谷子类甜蛋白家族基因密码子使用进化过程中主要受自然选择压力影响[17],而苋菜AmMYB2基因的密码子偏好性受突变压力的影响较大[9]。由于这种密码子使用偏好性的存在会导致外源基因密码子与宿主表达系统中密码子的使用频率差异显著,直接影响外源基因的表达与翻译,因此,研究密码子偏好性有助于为外源基因选择更优的表达系统,这对于提高基因的表达效率必不可少[18]。
密码子优化在增强异源系统中的蛋白质和DNA表达的过程中起着重要作用[19]。辣椒中含有丰富的类胡萝卜素[20],是研究植物类胡萝卜素化学和生物合成的重要植物,成熟的辣椒果实中含有α-胡萝卜素、β-胡萝卜素、玉米黄质、叶黄素、隐黄质、辣椒红素及辣椒玉红素等多种不同的类胡萝卜素,其种类和含量决定辣椒成熟果实的颜色,从而影响果实品质[21]。因此本研究以辣椒PSY基因为例,预测最合适PSY基因的宿主。借助生物信息学的分析方法,提取番茄、辣椒、烟草等10种植物PSY基因的CDS序列,计算其碱基组成、有效密码子数、同义密码子相对使用度等参数,以揭示10种植物对PSY基因密码子的使用偏好性。
1、材料与方法
1.1序列数据
10种植物PSY基因的全长编码区序列均来源于NCBI的GenBank数据库,登录号见表1。
表1PSY基因序列登录号
1.2相关密码子偏性分析指标
借助于CodonW1.4.4软件分析比较10种植物PSY基因密码子使用特性的参数,统计同义密码子第3位上的各个碱基含量(A3s、C3s、G3s和U3s)、密码子整体GC含量、编码同一氨基酸同义密码子第3位上的GC含量(GC3s),用于衡量碱基组成偏好程度。同时运用EMBOSS中的CUSP和CHIP在线程序计算10种植物PSY基因的有效密码子数用于评价基因整体密码子使用偏好性的程度。FOP值用于衡量最优密码子在同义密码子中的使用频率,其值在0.360~1.000,FOP值越大密码子使用频率越强[22]。密码子适应指数(CAI)用于估计高表达基因中首选密码子的倾向程度。CAI值介于0和1.0之间,密码子的CAI值越接近于1表示某基因中该密码子使用偏好性越强,表达水平较高[23]。
1.3密码子使用偏差分析
通过计算59个同义密码子的相对使用度(不包括Met、Trp和3个终止密码子),来衡量10种植物PSY密码子使用偏好性。RSCU值小于1.0时表示该密码子使用频率低;等于1.0时表示该密码子使用无差别;大于1.0时表示对该密码子具有强的使用性[24]。
1.4ENC绘图分析
ENC用于测量密码子偏倚于单个基因的程度。ENC的值从20(对于具有极端偏差的基因,仅使用一个每个氨基酸的密码子)至61(对于没有使用同义密码子的偏差的基因)。ENC绘图分析揭示ENC值和GC3s分布的关系,反映碱基组成对密码子偏好性的影响程度。
1.5奇偶偏好分析及保守性分析
基于PSY基因密码子第3位上的4种碱基含量,以A3/(A3+T3)值为纵坐标,G3/(G3+C3)值为横坐标绘图,以坐标(0.5,0.5)为中心,从该中心出发的矢量表示了奇偶偏好(parityrule2,PR2)的程度和方向。利用DNAMAN8软件对PSY基因的CDS序列进行保守性分析。
1.6数据统计
密码子参数的相关性系数采用SPSS18.0软件分析,使用MEGA5.0软件根据10个物种的CDS序列构建遗传进化树。使用TBtools对10种植物密码子的RSCU值进行物种间聚类。CaPSY基因的密码子频率是使用CUSP程序计算。拟南芥、酿酒酵母、烟草、大肠杆菌和玉米基因组的频率从密码子使用数据库获得。
2、结果与分析
2.110种植物PSY基因密码子基础组成
表2列出了10种植物的PSY基因编码区核苷酸序列中A3s、C3s、U3s、G3s、GC和GC3s的含量。GC含量为0.419~0.452。与A3s、U3s、C3s和G3s的值相比,10种植物对于PSY密码子使用优先选择A和U末端密码子。这表明U末端或A末端同义密码子优先用于PSY编码区。GC3s含量为0.342~0.409,FOP含量为0.312~0.424。其中拟南芥、胡萝卜和番木瓜的FOP值偏离0.360程度高,表明这3种植物对PSY基因密码子的使用偏好性更强。CAI值为0.145~0.184,其中拟南芥CAI与FOP的预测值为0.184与0.424,表明拟南芥对PSY基因密码子的使用偏好性强于其他9种植物。
表210种植物中PSY基因密码子使用参数
2.2ENC绘图与奇偶性分析
图1-a显示10种植物中PSY基因的ENC与GC3s的分布图。通过计算ENC值与GC3s两个参数之间的相关性,可以检验突变压力对PSY基因密码子偏好性的影响程度。PSY基因序列的ENC值从46.93波动到52.57,平均值为50.43。从ENC对GC3s的分布图中可以看出10个物种中的PSY基因均低于该曲线,但PSY基因分布范围不大,表明PSY基因密码子偏好性现象不仅仅受突变压力的影响,且10种植物PSY基因受突变压力影响程度相近。奇偶性结果显示(图1-b),AtPSY、FaPSY、CmPSY、DcPSY、ClPSY、CkPSY位于y轴0.5以上,矢量向上及左侧(大多数偏左),2个方向偏倚,说明这6种植物基因密码子第3位A和T的含量较高,LcPSY、CaPSY、NtPSY、SIPSY的G3/G3+C3位于x轴0.5右侧,说明该基因密码子第3位碱基G的使用频率大于C碱基。若PSY基因密码子的偏好性的形成完全受突变压力影响,则嘌呤碱基的使用频率与嘧啶碱基的使用频率应该相等,即A碱基与T碱基,G碱基与C碱基的使用频率相等。这说明突变压力与自然选择都会影响这10种植物PSY基因的密码子偏好性。
2.310种植物PSY基因RSCU值分析
为了研究PSY基因的密码子使用模式,理解10种植物PSY基因的密码子偏好性使用差异,使用TBtools构建了不同物种PSY基因RSCU的层次聚类分析(图2)。结果表明,有几个同义密码子在物种间保持密码子使用的显著差异。不同物种中对于UUG、AGA、AGG、GGA、GAU、ACA、GUU、CCU、GCU、UCU、UCA的偏好性超过其他密码子。
2.4PSY基因密码子偏好性的聚类分析
基于PSY基因的RSCU值的聚类树(图3)。显示出基于PSY基因CDS区序列而构建的系统发育树不相同的结果(图4),例如,DcPSY与FaPSY在系统发育树中位于同一族,而在聚类数中,CkPSY与FaPSY在一个组中。表明10种植物PSY基因密码子使用模式存在一定差异。利用DNAMAN软件对10种植物PSY基因的CDS区进行多序列比对来分析其序列保守性(图5),在902~1010bp发现1个具有较多碱基的序列保守区(图5红方框内序列),利用此位置的序列设计引物,有利于准确的克隆PSY基因。
图110种植物的PSY基因的同义第3密码子位置(GC3s)与有效密码子数(ENC)含量的分布及奇偶性分析
图2PSY基因的同义密码子相对使用度(RSCU)的分层聚类分析
图3用于PSY基因的RSCU的聚类树
图4由PSY基因编码的CDS序列的系统发育树
图510种植物的PSY基因编码区序列的联配(部分展示)
2.5辣椒PSY基因的合适表达宿主的确定
为了选择PSY基因的合适表达宿主,以辣椒PSY基因密码子为代表,计算密码子使用频率与多个物种基因组之间的关系(表3)。结果表明,辣椒PSY基因在大肠杆菌(Escherichiacoli)和酿酒酵母(Saccharomycescerevisiae)中的使用频率高于其他物种,表明大肠杆菌和酿酒酵母是最合适PSY基因的宿主。
3、结论与讨论
研究发现有许多因素影响植物对PSY基因密码子的偏好性使用,可能涉及的有基因表达水平、自然选择、基因长度或GC的组成成分等[25,26]。本研究通过分析10种植物对PSY基因的密码子使用,发现10种植物对于PSY基因密码子优先选择含有A和U末端密码子。定向突变压力和自然选择是决定密码子偏好性的两个主要因素[27]。密码子适应指数(CAI)用于估计高表达基因中首选密码子的倾向程度。CAI值介于0和1.0之间,较高的值可能表示密码子使用偏好性更强,表达水平更高。本研究中发现拟南芥的CAI值比其他植物更高,预测拟南芥对PSY基因密码子的使用偏好性更强,但通过对10种植物PSY基因RSCU值分析,当以RSCU值>1.6为标准时,发现烟草对PSY基因密码子的使用偏好性强于拟南芥。前人研究发现,在高表达基因中,密码子适应指数与密码子使用偏好性具有密切联系,而在低表达基因中,突变决定密码子使用的偏好性[28,29,30]。研究发现所有PSY基因都具有低表达水平,表明植物对PSY基因密码子的使用偏好性可能与突变有关[31]。
ENC与GC3s的绘图分析已被广泛用于研究各种物种间基因的密码子使用[32,33,34,35]。本研究发现10种植物中的PSY基因ENC值均低于标准曲线,但PSY基因分布范围不大,表明PSY基因密码子偏好性现象不仅仅受突变压力的影响。奇偶性结果显示,大部分点位于y轴0.5以上,矢量向上及左侧(大多数偏左)两个方向偏倚,结果显示10种植物基因密码子第3位A和T的含量较高,表明密码子使用偏性现象不仅仅由突变压力引起,还受其他因素的影响。基于PSY基因密码子的RSCU值的聚类树PSY基因的CDS区序列而构建的系统发育树不相同的结果,表明10种植物PSY基因密码子使用偏好性存在一定的差异。利用DNAMAN软件对10种植物的PSY基因的CDS进行了序列联配,在902~1010bp处发现1个具有较多碱基的序列保守区,利用此位置的序列设计引物,有利于准确的克隆PSY基因。
表3辣椒PSY基因密码子使用频率与多个物种基因组之间的关系
基因的表达效率与受体系统密码子使用偏好性息息相关。根据受体生物密码子使用偏好性,对目标基因进行序列改造和修饰,是提高表达效率的有效途径之一[36]。辣椒是一种重要的蔬菜作物,在世界各地广泛栽培,同时辣椒中含有丰富的类胡萝卜素[20]。类胡萝卜素含量和成分的不同影响果实的品质进而影响商品价值;类胡萝卜素作为抗氧化剂,对人类癌症和心血管疾病预防能起到一定作用。PSY基因作为类胡萝卜素合成的关键酶基因,了解辣椒PSY基因密码子的使用偏好性并选择合适的表达宿主显得尤为重要,本研究以辣椒为例,计算密码子使用频率与多个物种基因组之间的关系。结果表明,辣椒PSY基因在大肠杆菌(E.coli)和酿酒酵母(S.cerevisiae)中的使用频率高于其他物种,表明大肠杆菌和酿酒酵母是最合适PSY基因的宿主。
参考文献:
[9]彭丽云,王云,孙雪丽,等.苋菜AmMYB2基因密码子偏好性与进化分析[J].应用与环境生物学报,2019,25(3):679-686.
[10]王云,彭丽云,苏立遥,等.龙眼Hsf基因家族密码子使用模式分析[J].分子植物育种,2019,17(17):5595-5603.
[17]刘潮,韩利红,王海波,等.谷子类甜蛋白基因家族的鉴定与密码子偏性分析[J].西北农业学报,2018,27(1):52-61.
[18]李凌烜,陈安琪,黄凯,等.豆科植物dxr基因密码子偏好性分析[J/OL].生物学杂志,2019-11-06.
[20]李大伟,郝万江,巩振辉,等.辣椒果色遗传与分子生物学研究进展[J].辣椒杂志,2014(2):1-5.
[21]李全辉,邵登魁,李江,等.辣椒果实类胡萝卜素生物合成研究进展[J].植物遗传资源学报,2019,20(2):5-14.
[24]冯海悦,张羽,吴正常,等.13种哺乳动物MUC4基因密码子使用模式分析[J].农业生物技术学报,2018,26(9):1546-1556.
[31]赖瑞联,冯新,高敏霞,等.美味猕猴桃过氧化物酶基因AdPOD27的密码子偏好特征分析[J].热带作物学报,2018,39(7):1344-1350.
[32]戴开宇,黄焱杰,吴丽思,等.猪2基因密码子使用偏好性分析及优化[J].中国畜牧兽医,2018,45(7):1863-1872.
[33]郝豆豆,张勇群,雷鸣,等.10种藏药材ccmFN基因片段密码子偏好性分析[J].中成药,2018,40(7):1551-1557.
[34]苏少锋,赵一萍,白东义,等.马转录因子TBX3基因的密码子使用偏好性分析[J].中国农业大学学报,2018,23(7):53-65.
[35]晁岳恩,吴政卿,杨会民,等.11种植物psbA基因的密码子偏好性及聚类分析[J].核农学报,2011,25(5):927-932.
李慧姬,吉雪花,朱冉冉,张中荣,张海英,吕慧.10种植物PSY基因密码子使用偏好性分析[J].西北农业学报,2020,29(02):276-284.
基金:国家自然科学基金(31860548);石河子大学育种专项(kx0301).
分享:
p53基因被广泛认为是一种关键的肿瘤抑制因子,在保护细胞完整性免受各种形式的基因毒性压力方面具有关键功能,包括DNA损伤、致癌激活和端粒侵蚀,然而,p53的突变会导致其肿瘤抑制功能的丧失和致癌活动的表现,因此,突变的p53基因已成为癌细胞增殖、侵袭和扩散的强有力的致癌驱动因素,引起了许多研究的极大关注。
2025-08-05地中海贫血(简称地贫)是一种常见的单基因常染色体隐性遗传病,是由于珠蛋白基因发生突变或缺失,致使珠蛋白链合成受抑制,使形成血红蛋白的α链与β、γ、δ链比例失衡,而导致的一组遗传性溶血性疾病。地贫根据突变的珠蛋白肽链位置,可以分为α-地贫、β-地贫、δ-地贫、δβ-地贫等类型,在中国以α-地贫和β-地贫最为常见[1]。
2025-03-26骨关节炎(Osteoarthritis,OA)是一种常见的退行性关节疾病,病理发展过程以膝关节软骨下骨和软骨的退行性改变为主,是导致膝关节运动功能障碍和慢性致残的主要疾病之一,也是中老年人的常见病和多发病,临床表现主要以膝关节疼痛、肿胀、畸形,以及功能活动受限等为主。 随着老龄化社会的到来,骨关节炎发病率不断上升,严重影响中老年患者的生活质量,同时也给患者家庭和社会带来巨大的经济负担。
2025-03-21地中海贫血(简称“地贫”)是由于珠蛋白肽链基因突变或缺失,使某种珠蛋白肽链合成障碍而导致的一组单基因遗传性慢性溶血性血红蛋白病。根据珠蛋白肽链合成障碍的不同,可将地贫分为α型、β型、δβ型和δ型4种,其中以α型和β型地贫较为常见。
2024-10-08腺苷脱氨酶2(adenosine deaminase 2,ADA2)是一种二聚体分泌蛋白,主要由骨髓来源的髓样细胞合成并分泌到细胞外。ADA2除了参与机体嘌呤核苷酸代谢过程,还在促进血管内皮细胞生长、单核细胞增生并向抗炎M2型巨噬细胞分化以及调节中性粒细胞活性等过程中发挥着重要作用。
2024-04-28先天性马蹄内翻足是小儿骨关节结构畸形中最常见的一种先天性足畸形,如果不及时治疗,将持续到成年期,导致行动不便和生活质量下降;其特征是后足内翻、前足内收、踝部马蹄和高弓足,较难矫正,发病率为1‰~4‰,男女比例为2.5∶1.0,双侧较单侧多发。目前,先天性马蹄内翻足的病因尚未明晰。
2024-04-11染色体Xp22.33和Yp11.32短臂末端的拟常染色体异常是导致身材矮小的最常见原因之一。SHOX基因位于性染色体X和Y染色体短臂的末端(Xp22.33或Ypll.3)拟常染色体区域内,该基因是Rao等于1997年首次克隆并定位的,包含6个外显子,全长35Kb, 其中完全编码序列为879bp。
2024-03-29智力障碍(intellectual disorder, ID)是儿童期常见的神经系统疾病,发病率为1%~3%。ID病因复杂,其中遗传因素约占其发病病因的50%。遗传因素主要包括染色体异常、拷贝数变异和单基因/多基因变异等。据报道,已有近2 000个基因与ID相关,但仍有50%左右的患者得不到明确诊断。
2024-03-28由于染色体复制、分配时产生错误等原因,DNA从染色体中脱落下来,形成环状DNA,散落在细胞中,称为染色体外环状DNA(extrachromosomal circular DNA, eccDNA)。eccDNA参与先天免疫反应、肿瘤生长等诸多生理和病理过程,成为了疾病诊断、癌症治疗等领域的研究重点。
2023-09-15多指(趾)畸形是一种常见的四肢畸形,单发最为常见,也可与并指(趾)和/或其它骨骼畸形同时存在,临床数据表明多指(趾)畸形患病特点是男性高于女性(5∶1),右手高于左手(2∶1)[1]。多指(趾)畸形在临床上分类复杂,一些综合征型多指(趾)畸形与其他疾病难以辨别。一般在婴儿出生时便可观察到多指(趾)形态,但综合征型多指(趾)的其他症状只能在生长发育过程中慢慢体现出来。
2021-12-06人气:5015
人气:4496
人气:4337
人气:3702
人气:3525
我要评论
期刊名称:生物多样性
期刊人气:1935
主管单位:中国科学院
主办单位:中国科学院生物多样性委员会,中国植物学会,中国科学院植物研究所,中国科学院动物研究所,中国科学院微生物研究所
出版地方:北京
专业分类:生物
国际刊号:1005-0094
国内刊号:11-3247/Q
邮发代号:82-858
创刊时间:1993年
发行周期:月刊
期刊开本:大16开
见刊时间:一年半以上
影响因子:1.343
影响因子:1.227
影响因子:1.286
影响因子:0.000
影响因子:1.349
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!