生物百科  > 所属分类  >  遗传学   
[1] 评论[0] 编辑

遗传密码

遗传密码决定蛋白质氨基酸顺序的核苷酸顺序  ,由3个连续的核苷酸组成的密码子所构成  。由于脱氧核糖核酸(DNA)双链中一般只有一条单链(称为有义链或编码链)被转录为信使核糖核酸(mRNA),而另一条单链(称为反义链)则不被转录,所以即使对于以双链 DNA作为遗传物质的生物来讲,密码也用核糖核酸(RNA)中的核苷酸顺序而不用DNA中的脱氧核苷酸顺序表示。

简介

在转移核糖核酸(tRNA)分子中有一组与mRNA中的密码子配对的三联体,称为反密码子。每种tRNA携带一种特定的氨基酸,在遗传密码的解读中起着关键性的作用。1961年英国分子生物学家 F·H·C·克里克等在大肠杆菌噬菌体T4中用遗传学方法证明密码子由三个连续的核苷酸所组成 。美国生物化学家M·W·尼伦伯格等从1961年开始用生物化学方法进行解码研究。1964年尼伦伯格等人进行人工合成的三核苷酸和氨基酰-tRNA、核糖体三者的结合试验,证明三核苷酸已经具备信使的作用。通过种种实验,遗传密码已于1966年全部阐明。表中所列的64个密码子编码18种氨基酸和两种酰胺。至于胱氨酸、羟脯氨酸、羟赖氨酸等氨基酸则都是在肽链合成后再行加工而成的。64个密码子中还包括3个不编码任何氨基酸的终止密码子 ,它们是UAA、UAG、UGA。这种由3个连续的核苷酸组成的密码称为三联体密码。

1954年2月,美国物理学家Gamow根据Watson和Crick发表的DNA双股螺旋结构,提出了DNA的腺嘌呤N5C5H5,鸟嘌呤N5C5H5O,胞嘧啶N3C4H5O和胸腺嘧啶N2C5H6O2等四种碱基可能就是密码子的最初设想。1955-1956年,Gamow陆续发表文章,从排列组合计算,1种碱基对应1种氨基酸不够,2种碱基的16种组合对应20种氨基酸也不够,4种碱基的256种组合对应20种氨基酸太多,只有三种碱基组成64种组合对应20种氨基酸较合适。1959年,Crick本人提出“中心法则”支持Gamow的假说;1961年,Crick和Brenner用实验证明了细菌和噬菌体遗传密码的三联性质。1961年夏天,Nirenberg领导的生化小组合成了碱基尿嘧啶,然后用3个尿嘧啶合成了苯丙氨酸分子,从而确定了Crick所排遗传密码表的第一个密码子的意义:三个尿嘧啶是一个苯丙氨酸的密码子,并由此拉开了实验室里反应发生结果论证Gamow所提四种碱基分子排列对应蛋白质的二十种氨基酸分子的排列数计算的序幕。1964年,威斯康星大学的Khorana合成出了一个UG交替的共聚物…UGUGUGUGUG…,并用之作为合成蛋白质的信使,产生了半胱氨酸和缬氨酸交替的多肽链…半胱氨酸-缬氨酸-半胱氨酸-缬氨酸…,由此得出“UGU是半胱氨酸的密码子和GUG是缬氨酸的密码子”结论,并首创了实验室里“DNA链上碱基顺序不同致使反应发生的结果不同”分辨Gamow和Crick数学排列表中“某一类元素相同但顺序不同致使排列不同”的方法。1965-66,剑桥MRC分子生物学实验室的Clark等做出起始密码子结论;同一实验室的Brenner等和美国耶鲁大学的A.Garen等各自做出终止密码子结论。到1966年,关于Gamow所提出的64个排列对应20种氨基酸分子的遗传密码意义全部被实验室里的反应所破译。

破译过程

究竟是哪3个核苷酸组成1个密码子来决定哪个氨基酸呢?这是多年来一直困扰分子遗传学家与生化学家的一个老大难问题。这个问题的解决,美国科学家尼伦伯格(M·W·Nirenberg)与美籍印裔科学家霍拉纳(H·G·Khorana)贡献卓著。

阐明遗传密码这个难题,在1961年终于露出一线曙光。尼伦伯格先合成了一条全部由尿嘧啶核苷酸(U)组成的多苷酸链,即UUU……。然后将这种多聚U加入到含有20种氨基酸以及有关酶的缓冲液中,结果只产生了一种由苯丙氨酸组成的多肽链。这是一个惊人的发现:与苯丙氨酸对应的遗传密码是UUU。这是世界上解读出的第一个遗传密码子。后来,尼伦伯格及其合作者参考霍利的研究结果,将人工合成的密码子(核苷酸三联体)“栽种”在核糖体上,这个人工密码子便像天然的mRNA一样,从介质中“捞起”完全确定的tRNA及其所携带的氨基酸。尼伦伯格及其合作者合成了64种理论上可能的核苷酸三联体密码子,终于将64个密码子的含义一一解读出来。在这个64个密码子中,有3个并不编码任何氨基酸,而是作为蛋白质合成的终止信号(“句点”),称为终止密码子。
  
霍拉纳则按照事先的设计合成具有特定核苷酸排列顺序的人工mRNA(这个结果本身已是卓越的成就),并用它来指导多肽蛋白质的合成,以检测各个密码子的含义,证实了构成基因编码的一般原则和单个密码的词义。霍拉纳确定,在一个分子中,每个三联体密码子是分开读取的,互不重叠,密码子之间没有间隔。1966年,霍拉纳宣布基因密码已全部被破译。遗传密码的破译,是生物学史上一个重大的里程碑。尼伦伯格与霍拉纳于1968年荣获诺贝尔生理学医学奖

破译原理

DNA分子是由四种核苷酸的多聚体。这四种核苷酸的不同之处在于所含碱基的不同,即A、T、C、G四种碱基的不同。用A、T、C、G分别代表四种核苷酸,则DNA分子中将含有四种密码符号。以一段DNA含有1000对核苷酸而言,这四种密码的排列就可以有41000种形式,理论上可以表达出无限信息。

遗传密码(geneticcode)又是如何翻译的呢?首先是以DNA的一条链为模板合成与它互补的mRNA,根据碱基互补配对原则在这条mRNA链上,A变为U,T变为A,C变为G,G变为C。因此,这条mRNA上的遗传密码与原来模板DNA的互补DNA链是一样的,所不同的只是U代替了T。然后再由mRNA上的遗传密码翻译成多肽链中的氨基酸序列。碱基与氨基酸两者之间的密码关系,显然不可能是1个碱基决定1个氨基酸。因此,一个碱基的密码子(codon)是不能成立的。如果是两个碱基决定1个氨基酸,那么两个碱基的密码子可能的组合将是42=16。这种比现存的20种氨基酸还差4种因此不敷应用。如果每三个碱基决定一个氨基酸,三联体密码可能的组合将是43=64种。这比20种氨基酸多出44种,所以会产生多余密码子。可以认为是由于每个特定的氨基酸是由1个或多个的三联体(triplet)密码决定的。一个氨基酸由一个以上的三联体密码子所决定的现象,称为简并(degeneracy)。

每种三联体密码决定什么氨基酸呢?从1961年开始,经过大量的实验,分别利用64个已知三联体密码,找出了与他们对应的氨基酸。1966-1967年,全部完成了这套遗传密码的字典。大多数氨基酸都有几个三联体密码,多则6个,少则2个,这就是上面提到过的简并现象。只有色氨酸与甲硫氨酸这两种氨基酸例外,只有1个三联体密码。此外,还有3个三联体密码UAA、UAG和UGA不编码任何氨基酸,它们是蛋白质合成的终止信号。三联体密码AUG在原核生物中编码甲酰化甲硫氨酸,在真核生物中编码甲硫氨酸,并起合成起点作用。GUG编码结氨酸,在某些生物中也兼有合成起点作用。分析简并现象时可以看到,当三联体密码的第一个、第二个碱基决定之后,有时不管第三个碱基是什么,都可能决定同一个氨基酸。例如,脯氨酸是由下列四个三联体密码决定的:CCU、CCC、CCA、CCG。也就是说,在一个三联体密码上,第一个,第二个碱基比第三个碱基更为重要,这就是产生简并现象的基础。

同义的密码子越多,生物遗传的稳定性越大。因为当DNA分子上的碱基发生变化时,突变后所形成的三联体密码,可能与原来的三联体密码翻译成同样的氨基酸,或者化学性质相近的氨基酸,在多肽链上就不会表现任何变异或者变化不明显。因而简并现象对生物遗传的稳定性具有重要意义。

一代密码

遗传密码是由核苷酸组成的三联体。翻译时从起始密码子开始,沿着mRNA的5′——3′方向,不重叠地连续阅读氨基酸密码子,一直进行到终止密码子才停止,结果从N端到C端生成一条具有特定顺序的肽链。

“遗传密码”一词,现在被用来代表两种完全不同的含义,外行常用它来表示生物体内的全部遗传信息。分子生物学家指的是表示四个字母的核酸语言和20个字母的蛋白质语言之间关系的小字典。要了解核苷酸顺序是如何决定氨基酸顺序的,首先要知道编码的比例关系,即要弄清楚核苷酸数目与氨基酸数目的对应比例关系。

数学观点考虑,核酸通常有四种核苷酸,而组成蛋白质的氨基酸有20种,因此,一种核苷酸作为一种氨基酸的密码是不可能的。如果两种核苷酸为一组,代表一种氨基酸,那么它们所能代表的氨基酸也只能有42=16种(不足20种)。如果三个核苷酸对应一个氨基酸,那么可能的密码子有43=64种,这是能够将20种氨基酸全部包括进去的最低比例。因此密码子是三联体(triplet),而不是二联体,(duplet),更不是单一体(singlet)。

国际公认的遗传密码,它是在1954年首先由盖莫夫提出具体设想,即四种不同的碱基怎样排列组合进行编码,才能表达出20种不同的氨基酸。1961年,由尼伦伯格等用大肠杆菌无细胞体系实验,发现苯丙氨酸的密码就是RNA上的尿嘧啶UUU密码子,到1966年,64种遗传密码全部破译。

在64个密码子中,一共有三个终止密码子,它们是UAA、UAG和UGA,不与tRNA结合,但能被释放因子识别。终止密码子也叫标点密码子或叫无意义密码子。有两个氨基酸密码子AUG和GUG同时兼作起密码子,它们作为体内蛋白质生物合成的起始信号,其中AUG使用最普遍。

密码的最终破译是由实验室而不是由理论得出的,遗传密码体现了分子生物学的核心,犹如元素周期表化学的核心一样,但二者又有很大的差别。元素周期表很可能在宇宙中的任何地方都是正确的,特别是在温度压力地球都相似的条件下。但是如果在其他星球也有生命的存在,而那种生命也利用核酸和蛋白质,它们的密码很可能有巨的差异。在地球上,遗传密码只在某些生物中有微小的变异。克里克认为,遗传密码如同生命本身一样,并不是事物永恒的性质,至少在一定程度上,它是偶然的产物。当密码最初开始进化的,它很可能对生命的起源起重要作用。

二代密码

对生命遗传信息存储传递及表达的认识是20世纪生物学所取得的最重要的突破。其中的关键问题是由3个相连的核苷酸顺序决定蛋白质分子肽链中的1个氨基酸,即“三联遗传密码”(‘第一遗传密码“)的破译。但是蛋白质必须有特定的三维空间结构,才能表现其特定的生物功能。50年代Anfinsen提出假说,认为蛋白质特定的三维空间结构是由其氨基酸排列顺序所决定的,并因此获得诺贝尔奖.这一论断现在已被广泛接受,大量实验充分说明氨基酸
顺序与蛋白质空间结构之间确实存在着一定的关系。遗传信息的传递,应该是从核酸序列到功能蛋白质的全过程.现有的遗传密码仅有从核酸序列到无结构的多肽链的信息传递,因此是不完整的.本文讨论的是从无结构的多肽链到
有完整结构的功能蛋白质的信息传递部分。完整的提法应该是遗传密码的第二部分,即蛋白质中氨基酸序列与其空间结构的对应关系,国际上称之为第二遗传密码或折叠密码(以下简称第二密码)。Anfinsen原理认为,和一定的氨基酸序列相对应的空间结构是热力学上最稳定的结构,但多肽链折叠成为相应的空间结构在实际上还存在一个“这一过程是否能够在一定时间内完成”的动力学问题。事实上蛋白质最稳定结构与一些相似结构之间的能量差并不大,约在20.9~83.7kJ/mol左右。

蛋白质之所以最容易形成天然结构除能量因素外,是由动力学和熵的因素所决定的。近10余年来国际上在蛋白质天然结构形成的问题上发生了概念上的变革。过去曾经认为新生肽链能够自发地折叠成为完整的空间结构,分子伴侣的发现已经把过去经典的自发折叠概念转变为,有帮助的肽链的自发折叠和组装“的新概念”。“自发”是指由第二遗传密码决定折叠终态的“内因”亦即热力学因素,而“帮助”则是为保证该过程能高效完成的“外因”,是由一类新发现的分子伴侣蛋白和折叠酶来帮助完成的,主要是帮助克服动力学和熵的障碍,因而帮助克服细胞内由各种因素引起折叠错误并造成翻译后多肽链分子的聚集沉淀而最终导致信息传递中止。新生肽成熟为活性蛋白的过程中,不仅有折叠中间体与分子伴侣和折叠酶的相互作用,还有亚基间相互作用而组装成有功能的多亚基蛋白,以及错误折叠分子与特异蛋白水解酶的识别和作用以从细胞内清除构象错误的分子等。细胞内折叠过程也是一个蛋白分子内和分子间肽链相互作用的过程.细胞内新合成的多肽链浓度极高,这种“拥挤”状态会加剧蛋白分子间的错误相互作用而导致分子聚集。

主要特点

遗传密码子具有以下基本特点:
1)每个密码子三联体(triplet)决定一种氨基酸;

2)两种密码子之间无任何核苷酸或其它成分加以分离,即密码子无逗号;

3)密码子具有方向性,例如AUC是Ile的密码子,A为5'端碱基,C为3'端碱基。因此密码也具有方向性,即mRNA从5'端到3'端的核苷酸排列顺序就决定了多肽链中从N端到C端的氨基酸排列顺序;

4)密码子有简并性(degeneracy)一种氨基酸有几个密码子,或者几个密码子代表一种氨基酸的现象称为密码子的简并性。除了Met和Trp只有一个密码子外,其它氨基酸均有二个以上密码子,例如Arg有6个密码子。

5)共有64个密码子,其中AUG不仅是Met或者fMet(在原核细胞)的密码子,也是肽链合成的起始信号,故称AUG为起始密码子。UAA、UAG和UGA为终止密码子,不代表任何氨基酸,也称为无意义密码子。

6)密码子有通用性,即不论是病毒、原核生物还是真核生物密码子的含义都是相同的。但真核细胞线粒体mRNA中的密码子与胞浆中mRNA的密码子有以下三点不同:一是线粒体中UGA不代表终止密码子,而是编码Trp;二是肽链内的Mer由AUG和AUA二个密码子编码,起始部位的Met由AUG、AUA、AUU和AGG均为密码;三是AGA和AGG不是Arg的密码子,而是终止密码子,即UAA、UAG、AGA和AGG均为终止密码子。

7)摆动性。mRNA山歌密码子与tRNA上的反密码子结合时具有一定摆动性,即密码子的第3位碱基与反密码子的第1位碱基酸对时并不严格,见图(遗传密码碱基配对) 。配对摆动性完全是由tRNA反密码子的空间结构所决定的。反密码子5'端的碱基处于L形tRNA的顶端,受到的碱基对吉利的束缚比较小,因此有较大的自由度。。反密码的第1位碱基常出现稀有碱基,如次黄嘌呤I 见图(摆动现象 anticodon:反密码子;codon: 密码子)

摆动现象
,与A、C、U之间皆可形成氢键而结合,这是最常见的摆动现象。这种摆动现象使得一个tRNA所携带的氨基酸可排列在2-3个不同的密码子上,因此当密码子的第3位碱基发生一定程度的突变时,并不影响tRNA带入正确的氨基酸。

密码子结构与氨基酸侧链极性之间有一定关系
1)氨基酸侧链极性性质在多数情况下由密码子的第二个碱基决定。第二个碱基为嘧啶(Y)时,氨基酸侧链为非极性,第二个碱基为嘌呤(P)时,氨基酸侧链侧有极性。

2)当第一个碱基为U或A,第二个碱基为C,第三个碱基无特异性时,所决定的氨基酸侧链为极性不带电;

3)当第一个碱基不是U,第二个碱基是G时,氨基酸侧链则带电。在此前提下,若第一个是C或A时,表示带正电的氨基酸;第一、第二个碱基分别是G、A时,此种氨基酸带负电。但上述关系也有个别例外。

医学应用

人类基因图谱的遗传密码序列最近即将全部揭晓,科学家大胆地预测医学即将进入分子医学与基因治疗的时代,我们不仅可以利用分子医学或生物晶片的方法,找出有问题的致病分子,利用基因工程的方法加以改造,进行所谓“基因治疗“,还可以分析某某人的全部遗传密码序列,提前预测将来发生某种疾病的倾向。一切似乎非常完美,真的是如此吗?

临床的疾病,真正属于单一基因发生突变的仍属少数,大部分的疾病依旧原因不明,据推测多基因(Polygenic)或多因子(Polyfactorial)的原因占了大宗。单基因的疾病,例如苯酮尿症(Phenylketonuria)、舞蹈症(Huntington’sChorea)、地中海型贫血(beta-Thalassemia)等只占了很小的比例,常见的疾病,例如高血压糖尿病退化性关节炎老人失智症,可能是好几个基因出了问题,加上环境的因素的影响。对于单基因的疾病,现在可以应用遗传连锁(Linkagestudy)的方法,将致病基因定位(Positionalcloning),再破解遗传密码,但是多基因或多因子造成的疾病,目前并没有可行的遗传学理论或实验方法,可以用来找到所有可能相关的基因。

因为受到医学伦理的约束,基因治疗的临床价值迄今仍未得到证明。基因治疗最早是针对ADA(Adenosinedeaminase)缺乏引起的免疫缺乏症(泡泡娃娃,Bubblebaby),由美国国家卫生院的FrancisAnderson等人主持,他们取出病人的骨髓细胞,用基因工程的技术加以改造,修补其免疫缺损,再重新输回病人的身体,基因治疗的同时,病人也接受ADA酵素的治疗,研究人员担心万一基因治疗无效,因此不敢贸然停止ADA的使用,基因治疗究竟是否有效,并没有客观的结论。

1980年代有学者在国际知名的Nature杂志上发表研究论文,指出精神分裂症及躁郁症与遗传的关系,精神分裂症的基因被定位于第五对染色体,躁郁症的基因则位于第十一对染色体,后来相关的研究并不能重复这些结果,因此早先发表的文章遭到撤回,试想高血压,糖尿病究竟是单基因、多基因、或者环境因素所造成,迄今仍原因未明,更何况这些复杂的精神疾病!

人类行为的遗传模式到现在仍不清楚,大部分精神分裂症及躁郁症的病人都是偶发的个案,偶而有家族史,但是很少有三代以上的家族病史,无法套用目前基因连锁定位(Linkagestudy)来做致病基因的染色体定位;大部分的病人多半在二十岁左右发病,不容易找到对象结婚,因此精神疾病如果完全是由于遗传基因的作用,他们的遗传基因也很难传递到下一代,但是人口中精神分裂症及躁郁症的病人所占的比例始终约略小于百分之一,这种现象很难以现有的遗传学理论解释;精神疾病目前诊断的方式,仍然以症状诊断为主,始终缺乏生物性的诊断方法,譬如抽血检查血液中的化学物质,或者影像学的检查,看看脑部那个结构出了问题;精神疾病的异质性(Heterogenecity)相当高,增加研究的困难度,很难区分究竟是先天遗传或者后天环境造成。

1980年代曾有学者以美国东部Amish族群作为研究躁郁症的对象,后来因为少数几个个案的诊断有疑义,整的研究结果受到质疑。自从Watson及Crick于1953年发表DNA的论文之后,分子生物学一日千里,经由国际上许多科学家的协同努力,今天终于揭开人类的遗传密码序列,但是行为科学与精神医学连入口在哪里,现在都还不知道,之所以如此艰难,是因为到目前为止,连最基本的心智功能都没有明确的定义,更遑论要整合各种研究的结论,例如记忆(Memory)就有好多种分法,譬如分成即时记忆、短程记忆及长程记忆,也可分为明确记忆(Explicitmemory)及隐含记忆(Implicitmemory),加上工作状态记忆(Workingmemory)等等;大脑可以记忆,小脑也有记忆能力,例如开车,遇到紧急状况踩煞车,通常是反射动作,不经过大脑考虑,单单对于记忆的了解就如此凌乱,其他如情绪、知觉、理解力、逻辑推理能力等等,迄今仍是浑沌一片。

乐观的看来,最近这十年,或者最近这一百年,不会有太大进展,悲观的一派则认为人类的心智永远没有解答,除非遗传学以及神经科学理论的基本架构有划时代突破性的发现。

社会贡献

第一密码的阐明解决了基因在不同生物体之间的转移与表达,开辟了遗传工程和蛋白工程的新产业。但是在异体表达的蛋白质往往不能正确折叠成为活性蛋白质而聚集形成包含体。生物工程的这个在生产上的瓶颈问题需要第二密码的理论研究和折叠的实验研究来指导和帮助解决。由于分子伴侣在新生肽链折叠中的关键作用,它一定会对提高生物工程产物的产率有重要的实用价值。

蛋白工程的兴起,已经使人们不再满足于天然蛋白的利用,而开始追求设计自然界不存在的全新的具有某些特定性质的蛋白质,这就开辟了蛋白设计的新领域。前面提到的把原来主要是β-折叠结构改变为一个主要是α-螺旋的新蛋白的设计就是这方面的一个例子,更多的努力将集中于有实用意义的蛋白设计上。近年来得知某些疾病是由于蛋白质折叠错误而引起的如类似于疯牛病的某些神经性疾病老年性痴呆症帕金森氏症。这已引起人们极大的注意。异常刺激会诱导细胞立即合成大量应激蛋白帮助细胞克服环境变化,这些应激蛋白多半是分子伴侣。由于分子伴侣

在细胞生命活动的各个层次和环节上都有重要的甚至关键的作用,它们的表达和行为必然与疾病有密切关系.如局部缺血化疗损伤心脏扩大高烧炎症感染代谢病细胞和组织损伤以及老年化都与应激蛋白有关。因此在医学上不仅开辟了与分子伴侣和应激蛋白有关的新的研究领域,也开创了广阔的应用前景。

相关词条

SD序列 顺式作用元件 内含子
外显子 基因领域效应 分子杂交

参考资料
1、《生物化学与生物物理学报》
2、http://www.biox.cn/content/20050411/10172.htm
3、http://scholar.ilib.cn/A-dyjydxxb200609038.html
4、http://genetics.sjtu.edu.cn/genetics/14.01.htm

附件列表


1

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。

如果您认为本词条还有待完善,请 编辑

上一篇 遗传学    下一篇 遗传性凝血因子ⅩⅢ缺乏

标签

同义词

暂无同义词