启动子
启动子是基因(gene)的一个组成部分,控制基因表达(转录)的起始时间和表达的程度。启动子(Promoters)就像“开关”,决定基因的活动。既然基因是成序列的核苷酸(nucleotides),那么启动子也应由DNA组成。启动子本身并不控制基因活动,而是通过与称为转录(transcription)因子的这种蛋白质(proteins)结合而控制基因活动的。转录因子就像一面“旗子”,指挥着酶(enzymes)(RNA聚合酶polymerases) 的活动。这种酶制造着基因的RNA复制本。基因的启动子部分发生改变(突变),则导致基因表达的调节障碍。这种变化常见于恶性肿瘤。
启动子是一段位于结构基因5'端上游区的DNA序列,能活化RNA聚合酶,使之与模板DNA准确地相结合并具有转录起始的特异性。因为基因的特异性转录取决于酶勺启动子能否有效地形成二元复合物,故RNA聚合酶如何有效地找到启动子并与之相结合是转录起始过程中首先要解决的问题。有实验表明,对许多启动子来说,RNA聚合酶与之相结合的速率至少比布期运动 中的随机碰撞高100倍。
现在已经知道,转录的起始是基因表达的关键阶段,而这一阶段的重要问题是RNA聚合酶与启动子的相互作用一:启动子的结构影响了它与RNA聚合酶的亲和力,从而影响了基因表达的水平。转录单元(transcription unit) 是一段从启动子开始至终止子(terminator)结束的DNA序列,RNA聚合酶从转录起点开始沿着模板前进,直到终止子为止,转录出一条RNA链、在细胞中,一个转录单元可以是一个基因,也可以是几个基因。转录起点是指与新生RNA链第一个核苷酸相对应DNA链上的碱基,研究证实通常为一个嘌呤。常把起点前面,即5’末端的序列称为上游(upstream),而把其后而即3’未端的序列称为下游(downstream)。在描述碱基的位置时,一般用数字表示,起点为+1,下游方向依次为+2、+3……,上游方向依次为-l、-2、-3……。
启动子区是RNA聚合酶的结合区,其结构直接关系到转录的效率。关于其结构特点,Pribnow设计了一个实验,他把RNA聚合酶全酶与模板DNA结合后,用DNase l水解DNA,然后用酚抽提,沉淀纯化DNA后得到一个被RNA聚合酶保护的DNA片段,约有41~44个核苷酸对。他先后分离了fd噬菌体、T7噬菌体的A2及A3启动子、h噬σ菌体的PR启动子及大肠杆菌乳糖操纵子的UV5启动子等5段被酶保护的区域,并进行了序列分析,以后又有人做了50多个启动子的序列分析后发现,在被保护区内有一个由5个核苷酸组成的共同序列,是RNA聚合酶的紧密结合点,现在称为Pribnow区(Pribnow box),这个区的中央大约位于起点上游10bp处,所以又称为-10区。
提纯被保护的片段后却发现,RNA聚合酶并不能重新结合或并不能选择正确的起始点,表明在保护区外可能还存在与RNA聚合酶对启动子的识别有关的序列。果然,科学家不久就从噬菌体的左、右启动子PL及PR和SY40启动子的-35 bp附近找到了另一段共同序列:TTGACA。经过数年的努力,分析了46个人肠杆菌启动子的序列以后.确证绝大部分启动子都存在这两段共同序列,即位于-10bp处(……T89A89T50A65A100……)的TATA区和-35 bp处(……T85T83G81A61C69A52……)的TTGACA区。现已查明,-10位的TATA区和-35位的TTGACA区是RNA聚合酶与启动子的结合位点,能与σ因子相互识别而具有很高的亲和力。
在真核生物基因中,Hogness等先在珠蛋白基因中发现了类似Pribrow区的Hogness区(Hogness box),这是位于转录起始点上游-25一-30 bP处的共同序列似TAAA,也称为TATA区。另外,在起始位点上游-70~-78 bp处还育另一段共同序列CCAAT,这是与原核生物中-35岫区相对应的序列.称为CAAT区(CAAT hox)。
许多原核生物都含有这两个重要的启动子区:(如图)
RNA聚合酶同启动子结合的区域称为启动子区。将各种原核基因同RNA聚合酶全酶结合后,用DNase I水解DNA,最后得到与RAN聚合酶结合而未被水解的DNA片段,这些片段有一个由5个核苷酸(TATAA)组成的共同序列,以其发现者的名字命名为Pribnow框(Pribnowbox),这个框的中央位于起点上游10bp处,所以又称—10序列(—10 sequence),后来在—35 bp处又找到另一个共同序列(TTGACA)。Hogness等在真核基因中又发现了类似Pribnow框的共同序列,即位于—25~—30 bp处的TATAAAAG,也称TATA框(TATAbox)。TATA框上游的保守序列称为上游启动子元件(upstream promoter element,UPE)或上游激活序列(uptreamactivatingsequence,UAS)。另外在-70~-78 bp处还有一段共同序列CCAAT,称为CAAT框(CAAT box)
原核生物中—10区同—35区之间核苷酸数目的变动会影响基因转录活性的高低,强启动子一般为17±1 bp,当间距小于15 bp或大于20 bp时都会降低启动子的活性。
在真核基因中,有少数基因没有TATA框。没有TATA框的真核基因启动子序列中,有的富集GC,即有GC框;有的则没有GC框。GC框位于—80~—110bp处的GCCACACCC或GGGCGGG序列。
TATA框的主要作用是使转录精确地起始;CAAT框和GC框则主要是控制 转录起始的频率,特别是CAAT框对转录起始频率的作用更大。如在TATA框同相邻的UPE之间插入核苷酸,也会影响转录使之减弱。
为什么RNA聚合酶能够仅在启动子处结合呢?显然启动子处的核苷酸顺序具有特异的形状以便与RNA聚合酶结合,就好像酶与其底物的结构相恰恰适合一样。将100个以上启动子的顺序进行了比较,发现在RNA合成开始位点的上游大约10bp和35bp处有两个共同的顺序,称为-10和-35序列。这两个序列的共同顺序如下,-35区“AATGTGTGGAAT”,-10区“TTGACATATATT”。大多数启动子均有共同顺序(consensus sequence),只有少数几个核苷酸的差别。
-10序列又称为Pribnow盒(原核生物)。在真核生物中相应的序列位于-35bp处,称为TATA盒,又称为Goldberg-Hognessbox,是RNA聚合酶Ⅱ的结合部位。-10和-35这两个部位都很重要:【1】RNA聚合酶能和-35和-10序列中的碱基和DNA主链中的磷酸基相接触;【2】离开共同顺序较远的启动子的活性亦较弱;【3】最重要的是,破坏启动子功能的突变中有75%都是改变了共同顺序中的碱基,其余25%亦为离共同顺序较近的。-35和-10序列相距约20bp,即大致是双螺旋绕两圈的长度。因为这两个结合区是在DNA分子的同一侧面,可见此酶是结合在双螺旋的一面。可以想像,它能"感觉到每个结合区的沟底中碱基所产生的特异形状。"
原核生物亦有少数启动子缺乏这两个序列(-35和-10)之一。在这种情况下,RNA聚合酶往往不能单独识别这种启动子,而需要有辅助蛋白质的帮助。可能是这些蛋白质因子与邻近序列的反应可以弥补启动子的这个缺陷。
在真核生物中,在转录起始位点上游70-80bp处有CAAT顺序,也称为CAAT盒。这一顺序也是比较保守的共同顺序:GCCTCAATCT。RNA聚合酶Ⅱ可以识别一顺序。近年来在对家兔β珠蛋白基因CAAT顺序的研究中发现,用人工方法诱导CAAT顺序发生突变使家兔β珠蛋白基因的转录水平降低。
启动子中的-10和-35序列是RNA聚合酶所结合和作用必需的顺序。但是附近其他DNA顺序也能影响启动子的功能。例如,在核糖体RNA合成的起始位点的上游50到150核苷酸之间的顺序就是对启动子的完全活性所必需的。如果这一段DNA顺序缺失并由其他外来DNA所取代(例如克隆在质粒DNA中的rRNA基因),则转录起始的频率将降低10倍。同样,在其他情况下,远隔部位的富有AT的DNA顺序被认为能增进转录起始的频率。有时候上游顺序可以是某些能直接激活RNA聚合酶的"激活蛋白"的结合部位。但是,上游顺序往往有另外的功能。例如上游顺序可以吸引拓扑异构酶,后者可导致结合的局部产生有利于转录起始的超螺旋状态。上游顺序所引起的DNA结构的微细变化可能在双螺旋上被传导到相当远的距离,因此上游顺序的变化可以影响到-10和-35区的DNA结构细节。
附件列表
词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。