信使RNA
Messenger RNA(mRNA)——信使核糖核酸
基本信息携带遗传信息,在蛋白质合成时充当模板的RNA。
从脱氧核糖核酸(DNA)转录合成的带有遗传信息的一类单链核糖核酸(RNA)。它在核糖体上作为蛋白质合成的模板,决定肽链的氨基酸排列顺序。mRNA存在于原核生物和真核生物的细胞质及真核细胞的某些细胞器(如线粒体和叶绿体)中。
原核生物和真核生物mRNA有不同的特点:
①原核生物mRNA常以多顺反子的形式存在。真核生物mRNA一般以单顺反子的形式存在。
②原核生物mRNA的转录与翻译一般是偶联的,真核生物转录的mRNA前体则需经转录后加工,加工为成熟的mRNA与蛋白质结合生成信息体后才开始工作 。
③原核生物mRNA半寿期很短,一般为几分钟 ,最长只有数小时(RNA噬菌体中的RNA除外)。真核生物mRNA的半寿期较长, 如胚胎中的mRNA可达数日。
④原核与真核生物mRNA的结构特点也不同。
原核生物mRNA一般5′端有一段不翻译区,称前导顺序,3′端有一段不翻译区,中间是蛋白质的编码区,一般编码几种蛋白质。真核生物mRNA(细胞质中的)一般由5′端帽子结构、5′端不翻译区、翻译区(编码区)、3′端不翻译区和3′端聚腺苷酸尾巴构成分子中除m7G构成帽子外,常含有其他修饰核苷酸,如m6A等。真核生物mRNA通常都有相应的前体。从DNA转录产生的原始转录产物可称作 原始前体(或mRNA前体)。一般认为原始前体要经过hnRNA核不均-RNA的阶段,最终才被加工为成熟的mRNA。
通常mRNA(单链)分子自身回折产生许多双链结构。原核生物,经计算有66.4%的核苷酸以双链结构的形式存在。真核生物mRNA也具有丰富的二级结构,折叠起来的mRNA二级结构有利于蛋白质合成的启动,以后mRNA处于伸展的状态则有利于转译的继续。
mRNA的复制,转录和翻译:由一个DNA分子,边解旋,边转录。利用细胞核内部的游离核糖核苷酸和成其需要的碱基,规则遵循碱基互补配对原则。注:因为mRNA没有T(胸腺嘧啶),所以模版中出现A(腺嘌呤)时,有U(尿嘧啶)代替。以上过程叫做转录,在细胞核中完成。接着,mRNA穿过核孔。和细胞质中的核糖体结合。选择tRNA运输氨基酸,和对应的三个碱基排列好(如何排列请查询:密码子)。再与其它的氨基酸通过肽键连接在一起,形成肽链。以上过程叫做翻译,在细胞质中完成。
虽然人们已经破译了决定生命基础的蛋白质的氨基酸合成密码,也知道了是DNA携带着这种密码,但是,根据细胞学所掌握的事实:所有DNA都呆在细胞核内,而蛋白质却存在于细胞质中,像DNA这样的大分子是无法随意进入细胞质的。然而密码总是会被带入细胞质的,这一来,人们不禁要问,是谁把锁在细胞核内的DNA手里的密码带入了细胞质的呢?科学家们从DNA那里拷贝了一份密码文件,并带入了细胞质中。经过试验和观察,发现这个信使就是RNA——核糖核酸。
信使RNA的发现储存在DNA分子中的这种遗传信息能在复制中产生更多的拷贝,并翻译成蛋白质。DNA的功能构成了信息的流动,遗传信息如何转变成蛋白质呢?转录就是其中的重要的一环。基因表达时以DNA的一条链为模板合成RNA,这一过程就是转录(transcription)。催化合成RNA的酶叫做RNA聚合酶(RNA polymerase)。RNA和DNA结构相似,所不同之处在于:(1)RNA一般以单链形式存在;(2)RNA中的核糖其C′-2不脱氧;(3)尿苷(U)取代了DNA中的胸苷。细胞中的RNA分成三种:mRNA(信使RNA),tRNA(转运RNA)和rRNA(核糖体RNA)。它们的功能各不相同。mRNA是合成蛋白质的模板,tRNA是转运特异氨基酸的运载工具,rRNA是合成蛋白质的装置。mRNA的碱基序列,决定着蛋白质装配时氨基酸的序列。
1955年Brachet用洋葱根尖和变形虫进行了实验;若加入RNA酶降解细胞中的RNA,则蛋白质合成就停止,若再加入从酵母中提取的RNA,则又可以重新合成一些蛋白质,这就表明,蛋白质的合成是依赖于RNA。
同年Goldstein和Plaut用同位素标记变形虫(Amoeba proteus)RNA前体,发现标记的RNA都在核内,表明RNA是在核内合成的。在标记追踪(pulse-chase)实验中,用短脉冲标记RNA前体,然后将细胞核转移到未标记的变形虫中。经过一段时间发现被标记的RNA分子已在细胞质中,这就表明RNA在核中合成,然后转移到细胞质内,而蛋白质就在细胞质中合成,因此RNA就成为在DNA和蛋白质之间传递信息的信使的最佳候选者。
1956年Elliot Volkin和 Lawrence Astrachan作了一项很有意思的观察:当E.coli被T2感染,迅速停止了RNA的合成,但噬菌的RNA却开始迅速合成。用同位素脉冲一追踪标记表明噬菌的RNA在很短的时间内就进行合成,但很快又消失了,表明RNA的半衰期是很短的。由于这种新合成的RNA的碱基比和T2的DNA碱基比相似,而和细菌的碱基比不同,所以可以确定新合成的RNA是T2的RNA。由于T2感染细菌时注入的是DNA,而在细胞里合成的是RNA,可见DNA是合成RNA的模板。最令人信服的证据来自DNA-RNA的杂交实验。Hall.B.D和Spiegeman,S,将T2噬菌体感染E.coli后立即产生的RNA分离出来,分别与T2和E.coli的DNA进行分子杂交,结果发现这种RNA只能和T2的DNA杂交形成“杂种”链,而不能和E.coli的DNA进行杂交。表明T2产生的这种RNA(即mRNA)至少和T2的DNA中的一条链是互补的。
Brenner,s. Jacob,F.和Meselson(1961)进行了一系列的的实验(图12-2),他们将E.coli培养在15N/13C的培养基中,因此合成的RNA和蛋白都被“重”同位素所标记。也就是说凡是“重”的核糖体,RNA和蛋白都是细菌的,然后用T2感染E.coli,细菌的RNA停止合成,而开始合成T2的RNA此时用普通的“轻”培养基(14N/12C),但分别以32P来标记新合成的T2 RNA,以35S标记新合成的T2蛋白,因此任何重新合成的核糖体,RNA,及蛋白都是“轻”的但带但有放射性同位素。经培养一段时间后破碎细胞,加入过量的轻的核糖体作对照,进行密度梯度离心,结果“轻”的核糖体上不具有放射性,“重”的核糖体上具有32P和35S,表明(1)T2未合成核糖体,“轻”核糖体却是后加放的。(2)T2翻译时是借用了细菌原来合成的核糖体,所以核糖体并无特异性,核糖体上结合的mRNA,其序列的特异性才是指导合成蛋白质的遗传信息,从而提出了mRNA作为“信使”的证据。因此他们将这种能把遗传信息从DNA传递到蛋白质上的物质称为“信使”。他们预言(1)这种“信使”应是一个多核苷酸;(2)②其平均分子量不小于5´105(假定密码比是3),足以携带一个基因的遗传信息;(3)它们至少是暂时连在核糖体上;(4)其碱基组成反映了DNA的序列;(5)它们能高速更新。Volkin和Astrachan发现高速更新的RNA似乎完全符合以上条件。Jacob和Monod将它定名为信使RNA(Messenger RNA)或mRNA。
信使RNA的合成与加工第一节 DNA转录生成RNA
一、定义
(一)转录单位
(二)启动子(promoter)
(三)终止子(terminator)
二、RNA聚合酶
(一)酶的特性:以4种NTP为底物,需模板和镁离子,合成方向也是5’-3’,但不需要引物。
(二)酶的分类:
1.噬菌体的RNA聚合酶结构简单,是单链蛋白,功能也简单。
2.细菌则具有复杂的多亚基结构(450Kd),可识别并转录超过1000个转录单位。
3.真核生物的酶有多种,根据a-鹅膏蕈碱(环状8肽,阻断RNA延伸)的抑制作用可分为三类:聚合酶A对它不敏感,分布于核仁,转录核糖体RNA;聚合酶B对低浓度敏感,存在于核质,转录信使RNA;聚合酶C位于核质,对高浓度敏感,转录小分子量RNA,如转运RNA、5SRNA等。各种RNA聚合酶都是由10-15种不同亚基组成的多亚基复合物。
4. 线粒体和叶绿体也有RNA聚合酶,结构简单,能合成所有种类RNA。
(三)酶的构成:大肠杆菌的全酶有5个亚基(α2ββ’ωσ),含2个锌。β催化形成磷酸二酯键,β’结合模板,σ亚基称为起始因子,可使RNA聚合酶稳定地结合到启动子上。ββ’ωσ称为核心酶。σ亚基在不同菌种间变动较大,而核心酶比较恒定。酶与不同启动子的结合能力不同,不同启动因子可识别不同的启动子。σ70识别启动子共有序列,σ32识别热休克基因,σ60在氮饥饿时起作用。σ通过随机移动起作用,不需解链。
(四)模板:以完整双链DNA为模板,其中仅一条链可转录。转录时局部解链,转录后DNA重新形成双螺旋结构,所以DNA是全保留的。
三、转录过程
分为起始、延长和终止三个阶段。起始包括对双链DNA特定部位的识别、局部(17bp)解链以及在最初两个核苷酸间形成磷酸二酯键。第一个核苷酸掺入的位置称为转录起点。
起始后起始因子离开,核心酶构象改变,沿模板移动,转录生成杂交双链(12bp),随后DNA互补链取代RNA链,恢复DNA双螺旋结构。延伸速度为50nt/s,酶移动17nm。错误几率为10-5。
聚合酶到达终点时,在终止辅助因子的帮助下停止反应,酶和RNA链脱落,转录结束。
四、启动子和转录因子
(一)定义:酶识别、结合、开始转录的一段DNA序列。强启动子2秒钟启动一次转录,弱启动子10分钟一次。
(二)原核生物:大肠杆菌在起点上游约-10碱基对处有保守序列TATAAT,称为pribnow box,有助于局部解链。在其上游还有TTGACA,称为-35序列,提供RNA聚合酶识别的信号。
(三)真核生物:复杂,差异较大。
1.信使RNA的启动子通常有三个保守区,-25到-30有TATA框,是解链位置,并决定转录起点;-75位置有CAAT框,与RNA聚合酶的结合有关;更上游还有GC框,某些转录因子可结合。后两个称为上游因子,对转录起始频率有较大影响。
2. 小RNA的启动子在转录区内部,有一些辅助因子帮助RNA聚合酶识别。
五、终止子和终止因子
(一)定义
(二)所有原核生物的终止子在终点之前都有一个回文结构,可使酶减慢移动或暂停合成。大肠杆菌有两类终止子:
1. 简单终止子,回文区有一段富含GC对的序列,回文后有寡聚尿苷。
2.依赖ρ的终止子,必须在有ρ因子时才能发挥作用,不含GC对,也无寡聚尿苷。ρ因子是蛋白质,可与酶作用,释放RNA,并使酶脱离。
(三)某些因子可使酶越过终止子继续转录,称为通读。常见于某些噬菌体的时序控制,早期基因与晚期基因以终止子相隔,早期基因产生抗终止因子,使发生通读以表达晚期基因。
六、转录的调控
(一)遗传信息的表达有时序调控和适应调控,转录水平的调控是关键环节,因为这是表达的第一步。转录调控主要发生在起始和终止阶段。
(二)操纵子是细菌基因表达和调控的单位,有正调节和负调节因子。阻遏蛋白的作用属于负调控。环腺苷酸通过其受体蛋白(CRP)促进转录,可促进许多诱导酶的合成。操纵子可构成综合性调控网络,如SOS反应等。对终止子也有调控作用,如衰减子。
(三)真核生物不组成操纵子,而是通过激素、生长因子等进行调控。某些DNA序列对转录起增强作用,称为增强子。
第二节 转录后加工
一、原核生物
(一)核糖体RNA:大肠杆菌共有7个核糖体RNA的转录单位,每个转录单位由16S、23S、5SRNA和若干转运RNA基因组成。16S和23S之间常由转运RNA隔开。转录产物在RNA酶III的作用下裂解产生核糖体RNA的前体P16和P23,再由相应成熟酶加工切除附加序列。前体加工时还进行甲基化,产生修饰成分,特别是a-甲基核苷。N4,2’-O二甲基胞苷(m4Cm)是16S核糖体RNA特有成分。5S核糖体RNA一般无修饰成分。
(二)转运RNA:有60个基因,其加工包括:
1.内切酶在两端切断,大肠杆菌RNA酶P是5’成熟酶
2.外切酶从3’修剪,除去附加顺序。RNA酶D是3’成熟酶
3.3’端加上CCAOH,由转运RNA核苷酰转移酶催化,某些转运RNA已有,切除附加序列后即露出。
4.核苷的修饰:修饰成分包括甲基化碱基和假尿苷,修饰酶具有高度特异性。甲基化对碱基和序列都有严格要求,一般以S-腺苷甲硫氨酸为甲基供体。
(三)信使RNA:细菌多数不用加工,转录与翻译是偶联的。也有少数多顺反子信使RNA必须由内切酶切成较小的单位,然后翻译。如核糖体大亚基蛋白与RNA聚合酶的b亚基基因组成混合操纵子,转录后需经RNA酶III切开,各自翻译。因为RNA聚合酶的合成水平低得多,切开有利于各自的翻译调控。较长的RNA会产生高级结构,不利于翻译,切开可改变其结构,从而影响其功能。
二、真核生物
(一)核糖体RNA:基因拷贝数多,在几十到几千之间。基因成簇排列在一起,由RNA聚合酶I转录生成一个较长的前体,哺乳动物为45S。核仁是其转录、加工和装配成核糖体的场所。RNA酶III等核酸内切酶在加工中起重要作用。5SRNA基因也是成簇排列的,由RNA聚合酶III转录,经加工参与构成大亚基。核糖体RNA可被甲基化,主要在核苷2’羟基,比原核生物甲基化程度高。多数核糖体RNA没有内含子,有些有内含子但不转录。
(二)转运RNA:由RNA聚合酶III转录,加工与原核相似,但3’端的CCA都是后加的,还有2’-O-甲基核糖。
(三)信使RNA:真核生物编码蛋白质的基因以单个基因为转录单位,但有内含子,需切除。信使RNA的原初转录产物是分子量很大的前体,在核内加工时形成大小不等的中间物,称为核内不均一RNA(hnRNA)。其加工过程包括:
1.5’端加帽子:在转录的早期或转录终止前已经形成。首先从5’端脱去一个磷酸,再与GTP生成5’,5’三磷酸相连的键,最后以S-腺苷甲硫氨酸进行甲基化,形成帽子结构。帽子结构有多种,起识别和稳定作用。
2. 3’端加尾:在核内完成。先由RNA酶III在3’端切断,再由多聚腺苷酸聚合酶加尾。尾与通过核膜有关,还可防止核酸外切酶降解。
3. 内部甲基化:主要是6-甲基腺嘌呤,在hnRNA中已经存在。可能对前体的加工起识别作用。
三、RNA的拼接
(一)转运RNA的拼接:由酶催化,酶识别共同的二级结构,而不是序列。通常内含子插入到靠近反密码子处,与反密码子配对,取代反密码子环。第一步由内切酶切除插入序列,不需ATP;第二步由RNA连接酶连接,需要ATP。
(二)四膜虫核糖体RNA的拼接:某些四膜虫26S核糖体RNA基因中有一个内含子,其拼接只需一价和二价阳离子及鸟苷酸或鸟苷存在即可自发进行。其实质是磷酸酯的转移反应,鸟苷酸起辅助因子的作用,提供游离3’羟基。
(三)信使RNA:真核生物编码蛋白质的核基因的内含子属于第二类内含子,左端为GT,右端为AG。先在左端切开,产生的5’末端与3’端上游形成5’,2’-磷酸二酯键,构成套索结构。然后内含子右端切开,两个外显子连接起来。通过不同的拼接方式,可形成不同的信使RNA。
第三节 RNA的复制
一、噬菌体QbRNA的复制
其RNA是单链,正链,侵入大肠杆菌后立即翻译,产生复制酶的b亚基,与宿主的三个亚基(α为核糖体蛋白,γ、δ均为肽链延长因子)构成复制酶,进行复制。先以正链为模板合成负链,再根据负链合成正链。合成负链时需要宿主的两个蛋白因子,合成正链则不需要,所以可大量合成。病毒的蛋白质合成受RNA高级结构的调控。
二、病毒RNA复制的主要方式
(一)病毒含正链RNA,先合成复制酶,复制后合成其他蛋白质进行装配。如噬菌体Qb及灰质炎病毒。
(二)病毒含负链和复制酶,先合成正链,再合成病毒蛋白和复制病毒RNA。如狂犬病毒。
(三)病毒含双链RNA和复制酶,如呼肠孤病毒。先复制正链,再翻译成病毒蛋白,最后合成负链,形成双链RNA分子。
(四)致癌RNA病毒:如白血病病毒和肉瘤病毒,先逆转录生成DNA前病毒,再转录、翻译。
第四节 RNA生物合成的抑制剂
一、碱基类似物
有些人工合成的碱基类似物能干扰和抑制核酸的合成。作用方式有以下两类:
(一)作为代谢拮抗物,直接抑制核苷酸生物合成有关酶类。如6-巯基嘌呤进入体内后可转变为巯基嘌呤核苷酸,抑制嘌呤核苷酸的合成。可作为抗癌药物,治疗急性白血病等。此类物质一般需转变为相应的核苷酸才能表现出抑制作用。
(二)进入核酸分子,形成异常RNA或DNA,影响核酸的功能并导致突变。5-氟尿嘧啶类似尿嘧啶,可进入RNA,与腺嘌呤配对或异构成烯醇式与鸟嘌呤配对,使A-T对转变为G-C对。因为正常细胞可将其分解,而癌细胞不能,所以可选择性抑制癌细胞生长。
二、DNA模板功能抑制物
(一)烷化剂:带有活性烷基,能使DNA烷基化。鸟嘌呤烷化后易脱落,双功能烷化剂可造成双链交联,磷酸基烷化可导致DNA链断裂。通常有较大毒性,引起突变或致癌。
(二)放线菌素类:可与DNA形成非共价复合物,抑制其模板功能。包括一些抗癌抗生素。
(三)嵌入染料:含有扁平芳香族发色团,可插入双链DNA相邻碱基对之间。常含丫啶或菲啶环,与碱基大小类似,可在复制时增加一个核苷酸,导致移码突变。如溴乙啶。
三、RNA聚合酶抑制剂
(一)利福霉素:抑制细菌RNA聚合酶活性。
(二)利链菌素:与细菌RNA聚合酶b亚基结合,抑制RNA链的延长。
a-鹅膏蕈碱:抑制真核生物RNA聚合酶。
信使RNA的结构与功能从 (DNA)转录合成的带有遗传信息的一类单链(RNA),它在上作为蛋白质合成的模板,决定肽链的排列顺序。1961年F.雅各布和根据大肠杆菌诱导酶生成的实验结果提出:信息从DNA到蛋白质之间的转移,必需有一种RNA起传递作用,由此提出了信使核糖核酸的名称。
生物体内的每种多肽链都由特定的mRNA编码,所以细胞内mRNA的种类很多,但通常每种mRNA的拷贝数极少(1~10个)。根据信息密码学说,3个连续的核苷酸可以编码一个氨基酸,因此从已知mRNA(或DNA)核苷酸顺序可以准确推导出蛋白质的一级结构。
存在范围和性质mRNA存在于原核和真核生物的细胞质及真核细胞的某些细胞器(如和)中。RNA病毒和RNA噬菌体中的 RNA既是遗传信息的载体又具有mRNA的功能。生物体mRNA种类的多少与生物进化水平有关,高等生物所含的遗传信息多,mRNA的种类也多。生物体内某种mRNA的含量根据需要而有不同,如5龄蚕后部丝腺体的主要任务是快速合成大量丝心蛋白,因而编码丝心蛋白的mRNA含量特别多。有些细菌需要不断适应外部环境,其体内编码某些诱导酶的mRNA的含量也较多。
原核和真核生物mRNA有不同的特点: ①原核生物mRNA常以多顺反子(见)的形式存在,即一条mRNA链编码几种功能相关联的蛋白质。真核生物mRNA一般以单顺反子的形式存在,即一种mRNA只编码一种蛋白质。②原核生物mRNA的转录与翻译一般是偶联的,即转录尚未完毕,蛋白质的转译合成就已开始 真核生物转录的mRNA前体则需经后加工,加工为成熟的mRNA与蛋白质结合生成信息体后才开始工作 信息体中蛋白质与RNA之比约为3。③原核生物mRNA半寿期很短,一般为几分钟,最长只有数小时(RNA噬菌体中的RNA除外)。真核生物mRNA的半寿期较长,如胚胎中的mRNA可达数日。④原核与真核生物mRNA的结构特点也不同。
一级结构与功能的关系原核生物mRNA一般5'端有一段不翻译区,称前导顺序,3'端有一段不翻译区,中间是蛋白质的编码区,一般编码几种蛋白质。如大肠杆菌乳糖操纵子mRNA编码3条多肽链;色氨酸操纵子mRNA编码5条多肽链。也有单顺反子形式的细菌mRNA,如大肠杆菌脂蛋白mRNA。原核生物mRNA分子中一般没有修饰核苷酸,也没有5'端帽子结构和3'端聚腺苷酸尾巴。在原核生物mRNA的起始密码子(AUG)附近(5'方向上游)的一小段长短不等的顺序,含有较多的嘌呤核苷酸,被称为SD顺序。它能和核糖体小亚基上的16SrRNA的3'端富含嘧啶核苷酸的区域配对结合,有助于带有甲酰甲硫氨酸的起始tRNA识别mRNA上的起始密码(AUG),使肽链合成从此开始。这段顺序是1974年由J.夏因和L.达尔加诺发现的,所以称为SD顺序,也称核糖体结合部位。原核生物mRNA的编码区一般编码几种功能上相关联的蛋白质,两种蛋白质的编码区之间常有一小段不翻译的顺序,叫做间隔区。有的噬菌体RNA中2个相邻的顺反子共用一段相同的编码顺序,例如,M 噬菌体RNA中的溶菌蛋白编码区共225个核苷酸中有189个核苷酸是由相邻两个蛋白质共用的。原核mRNA与真核mRNA一样使用同一套三联体密码子(真核生物线粒体mRNA有例外)。原核生物合成氨基酸的操纵子mRNA的5' 端前导顺序上有一段顺序称作弱化子。弱化子具有两种可以互变的构象,其中一种构象是转录终止的信号,能使转录中止(或衰减)。衰减调节是原核生物合成氨基酸的调控方式之一(见)。
真核生物 mRNA(细胞质中的)一般由5'端帽子结构、5'端不翻译区、翻译区(编码区)、3'端不翻译区和3'端聚腺苷酸尾巴构成(图1a[真核生物mRNA结构示意图a一级结构示意图] )。 分子中除 G构成帽子外,常含有其他修饰核苷酸,如 A等。5'端帽子结构通常有3种类型,即: G(5')ppp(5')N; G(5')ppp(5') N和 G(5')ppp(5') N。图1b[真核生物mRNA结构示意图b 5'端帽子结构式, , 表示碱基] , 表示碱基" class=image>[] 是帽子的化学结构,N右边的m代表核糖2'位羟基的甲基化。真核细胞线粒体中的mRNA无帽子结构。一般认为帽子的功能与翻译的启动有关。许多真核生物 mRNA(如珠蛋白mRNA)除去帽子后翻译效率大大降低。5'端不翻译区,也叫前导顺序。不同的真核mRNA的前导顺序长度不同,有的只有10个核苷酸,有的则有200个核苷酸。与原核mRNA相似,真核mRNA5'端不翻译区中常有一段顺序与核糖体小亚基上的18SrRNA的3'端的一段顺序互补并结合,这种结合与真核mRNA的翻译启动有关。
翻译区(编码区)使用的密码子除线粒体(如人、牛和酵母线粒体)外与原核生物mRNA是一样的。真核生物mRNA的起始密码子都是AUG。 真核和原核生物mRNA使用的密码子也都有“简并现象”,即几种不同的密码子翻译出同一种氨基酸,但不同的mRNA中简并密码子的利用率是不同的,真核与原核生物之间的差别就更大。mRNA的终止密码子有3个(UAG、UGA和UAA),其功能是停止翻译,一般只用一个终止密码子就能使翻译停止。有的mRNA有2个连续的终止密码子(见)。3'端不翻译区的长短在不同的mRNA上有所不同,β珠蛋白mRNA只有39个核苷酸,而卵白蛋白mRNA则有637个核苷酸。真核生物mRNA3'端不翻译区常有 AAUAA(A)或AUUUA(A)等顺序,它们和识别多聚A聚合酶及装配多聚A尾巴有关。除个别组蛋白mRNA外,真核生物mRNA3'端均有多聚A尾巴 3'端多聚A尾巴的长度随来源不同而不同,且随mRNA的老化而变短,通常有20~200个A。多聚A与mRNA稳定性及mRNA从细胞核转到细胞浆中有关。
真核生物mRNA的前体真核生物mRNA通常都有相应的前体。 从DNA转录产生的原始转录产物可称作原始前体(或mRNA前体)。 一般认为原始前体要经过hnRNA核不均-RNA的阶段,最终才被加工为成熟的 mRNA。hnRNA上的蛋白质编码区被一些居间顺序分隔成若干段;不同的基因转录产物所含的居间顺序的数目不同,人胰岛素只有两个,而牛眼的晶体蛋白则含有数十个;居间顺序的长短也各不相同,从数十个到上千个核苷酸(鸡卵白蛋白有一个1550个核苷酸的居间顺序)。居间顺序将在剪接过程中去除。约有10~40%的hnRNA含有3′端多聚A尾巴。hnRNA经过进一步加工切除居间顺序并把分隔的蛋白质编码区连接起来,最终成为成熟的mRNA。
二级结构与功能的关系通常mRNA(单链)分子自身回折产生许多双链结构(图2 [噬菌体M RNA中成熟蛋白] RNA中成熟蛋白" class=image>[编码区的二级结构及外壳蛋白的起始密码子 AUG的位置] )。原核生物,例如M 噬菌体RNA外壳蛋白编码区,经计算有66.4%的核苷酸以双链结构的形式存在。M RNA能翻译4种蛋白质,但效率各不相同。在通常条件下翻译外壳蛋白(其编码区在成熟蛋白的下游)的效率高于成熟蛋白的效率。但用甲醛处理M RNA破坏二级结构后,则翻译成熟蛋白的效率提高。 图2[噬菌体M RNA中成熟蛋] RNA中成熟蛋" class=image>[白编码区的二级结构及外壳蛋白的起始密码子 AUG的位置] 中外壳蛋白的起始密码子 AUG(1335~1337)通常处于环(Loop)的顶端,暴露在外面,因而易于与翻译的启动因子结合而进行翻译。成熟蛋白的编码区尽管处在外壳蛋白的前面,但其起始密码子GUG(130~132)却埋在二级结构之中,故翻译效率低,只有将二级结构松开(如甲醛处理)之后才能被翻译。可见mRNA分子的二级结构对翻译蛋白质的效率有很大影响。
真核生物mRNA也具有丰富的二级结构,如鸭珠蛋白mRNA和兔珠蛋白mRNA分别有45~60%和55~62%的核苷酸残基处在碱基配对之中。在真核生物蛋白质启动复合物中,40S核糖体实际上覆盖着mRNA上包括帽子结构在内的50~54个核苷酸,但是40S核糖体的大小比50个核苷酸的长度小得多 由于形成的发夹结构(二级结构使帽子与起始密码子之间的空间距离缩短)(图3[真核生物mRNA ]),造成40S核糖体能够覆盖包括帽子结构和起始密码子 AUG在内的50多个核苷酸,从而启动蛋白质合成。不同的mRNA中发夹结构的有无或多少各不相同。在蛋白质合成肽链继续延伸时,不需要帽子结构参加,此时核糖体覆盖的mRNA的区域约为25~35个核苷酸,mRNA的构象已不同于启动阶段而是处于一种伸展的状态,从而有利于转译的延续。可见,折叠起来的mRNA二级结构有利于蛋白质合成的启动,以后mRNA处于伸展的状态则有利于转译的继续。
信使RNA与密码子遗传信息从DNA分子抄录到RNA分子中的过程称为转录(transcription)。在真核生物中,最初转录生成的RNA称为不均一核RNA(heterogeneous nuclear RNA,hnRNA),然而在细胞浆中起作用,作为蛋白质的氨基酸序列合成模板的是mRNA(messenger RNA)。hnRNA是mRNA的未成熟前体。两者之间的差别主要有两点:一是hnRNA核苷酸链中的一些片段将不出现于相应的mRNA中,这些片段称为内含子(intron),而那些保留于mRNA中的片段称为外显子(exon)。也就是说,hnRNA在转变为mRNA的过程中经过剪接,被去掉了一些片段,余下的片段被重新连接在一起;二是mRNA的5′末端被加上一个m7pGppp帽子,在mRNA3′末端多了一个多聚腺苷酸(polyA)尾巴。mRNA从5′末端到3′末端的结构依次是5′帽子结构,5′末端非编码区,决定多肽氨基酸序列的编码区,3′末端非编码区,和多聚腺苷酸尾巴。多聚腺苷酸尾一般由数十个至一百几十个腺苷酸连接而成。随着mRNA存在时间的延续,这段聚A尾巴慢慢变短。因此,目前认为这种3′末端结构可能与增加转录活性以及使mRNA趋于相对稳定有关。原核生物的mRNA没有这种首、尾结构。
1961年,Jacob和Monod首先提出了mRNA的概念。在真核细胞中,由于蛋白质是在胞浆中而不是在核内合成,因此显然要求有一个中间物将DNA上的遗传信息传递至胞浆中。后来的研究证实,这种中间物即信使RNA.mRNA的核苷酸序列与DNA序列相应,决定着合成蛋白质的氨基酸序列。它如何指导氨基酸以正确的顺序连接起来呢?不同的mRNA碱基组成和排列顺序都不同,但都只有A,G,C,U4种碱基。如果一个碱基就可以决定一个氨基酸,则只有四种变化方式,如果两个碱基决定一个氨基酸,则只有16种变化方式,都不能满足20种氨基酸的需要。1961年Crick和Brenner的实验得出了三个核苷酸编码一个氨基酸的结论,并将这种三位一体的核苷酸编码称做遗传密码(genetic code)或三联体密码,这样就可以有64种不同的密码,但此情况下必须假定有一些氨基酸使用两个以上的密码。这一假定很快就被证明是对的。遗传密码具有下列特征:
(1)三个核苷酸组成一个密码子,每个密码子由三个前后相联的核苷酸组成,一个密码子只为一种氨基酸编码。共有64个密码子;
(2)密码子之间不重叠使用核苷酸,也无核苷酸间隔;
(3)一种氨基酸可有多个密码子,这个特点称为密码子的简并性;
(4)密码子的通用性,所有生物从最低等的病毒直至人类,蛋白质合成都使用同一套密码子表(表15-8),仅有极少的例外,如特殊细胞器线粒体,叶绿体所用的密码稍有不同。
通用遗传密码及相应的氨基酸
第一个核苷酸5′第二个核苷酸第三个核苷酸3′
UCAG
U苯丙氨酸丝氨酸酪氨酸半胱氨酸U
苯丙氨酸丝氨酸酪氨酸半胱氨酸C
亮氨酸丝氨酸终止码终止码A
亮氨酸丝氨酸终止码色氨酸G
C亮氨酸脯氨酸组氨酸精氨酸U
亮氨酸脯氨酸组氨酸精氨酸C
亮氨酸脯氨酸谷氨酰胺精氨酸A
亮氨酸脯氨酸谷氨酰胺精氨酸G
A异亮氨酸苏氨酸天冬酰胺丝氨酸U
异亮氨酸苏氨酸天冬酰胺丝氨酸C
异亮氨酸苏氨酸赖氨酸精氨酸A
蛋氨酸苏氨酸赖氨酸精氨酸G
G缬氨酸丙氨酸天冬氨酸甘氨酸U
缬氨酸丙氨酸天冬氨酸甘氨酸C
缬氨酸丙氨酸谷氨酸甘氨酸A
缬氨酸丙氨酸谷氨酸甘氨酸G
通用遗传密码与线粒体遗传密码之间的一些差异
密码子通用编码线粒体编码
哺乳动物果蝇酵母菌植物
UGA终止码色氨酸色氨酸色氨酸终止码
AUA异亮氨酸蛋氨酸蛋氨酸蛋氨酸异亮氨酸
CUA亮氨酸亮氨酸亮氨酸苏氨酸亮氨酸
AGA精氨酸终止码丝氨酸精氨酸精氨酸
注:下标横线者为与通用编码不同的编码
究竟哪一个密码子为哪一种氨基酸编码,即密码子与氨基酸之间的对应关系已在60年代研究解决了。1964年Nirenberg用一种RNA聚合酶体外合成了多聚尿苷酸、多聚腺苷酸等多聚核苷酸,将这些多聚核苷酸分别用于蛋白质的体外合成。发现,当所用的多聚核苷酸为多聚尿苷酸时,只有多聚苯丙氨酸合成,这意味着UUU为苯丙氨酸编码;用其它多聚核苷酸进行相应的实验后发现,CCC为脯氨酸编码,而AAA为赖氨酸编码;其后,有人又用核苷酸比例为已知,但是核苷酸序列随机的多聚核苷酸,以及用已知序列的含两种或两种以上核苷酸的多聚核苷酸进行相应的实验,将结果加以数理统计处理,又解读了一批密码子,其中包括三个终止码,最后,还有一些密码子是通过合成已知序列的三聚核苷酸与核蛋白体和载有放射性同位素标记的氨基酸的tRNA共沉淀原理予以解读的。在所有密码子中,AUG不仅为蛋氨酸编码,而且又是翻译(translation,以mRNA上的遗传信息指导核蛋白体上多肽链合成的过程)的起始信号,UAA、UAG和UGA不为任何氨基酸编码,而是作为翻译的终止信号,统称为终止码(stop codon),又常被叫作无意义码(nonsense codon)。
大多数氨基酸是由一个以上的密码子所编码。这个事实提出了一个问题:编码同一种氨基酸的一组密码子的使用频率是否都相同?细致的分析表明,无论是原核生物,还是高等真核生物,密码子的使用频率并不是平均的,有些密码子的使用率很高,有些则几乎不使用,其使用频率主要与细胞内tRNA含量呈正相关。
信使RNA与遗传信息的传递转录是在原核和真核细胞中以DNA为模板合成RNA的过程。
在原核和真核生物中,转录过程是相似的。包括DNA变性,RNA聚合酶结合在单链DNA上以5′→3′方向合成RNA分子。双链中只有一条链作为转录模板,合成单链RNA分子。启动子和终止子序列决定转录的起始和终止。
在E.coli中RNA多聚酶转录各种RNA(mRNA,tRNA和rRNA)。在真核细胞中有三类不同的RNA多聚酶,它们的功能不同。RNA pol Ⅰ转录4种rRNA中的3种;RNA pol Ⅱ转录mRNA和一些snRNA;RNAⅢ转录第四种rRNA,tRNA以及其余的snRNA。
3种真核生物的RNA pol,不像E.coli RNA pol,没有一个直接地和启动子区结合,而是通过转录起始因子的介导来起始RNA的合成。对于每一种RNA多聚酶来说,转录因子是特异的,它可以识别启动子的特殊序列。
蛋白质编码基因的启动子位于转录起始位点的上游,由不同组合的启动原件所构成。特异的转录因子和调节因子结合在这些原件上,促进RNA pol Ⅱ转录起始。增强子离启动子较远,它可被调节因子识别结合,具有促进基因转录的功能。
由RNA pol Ⅲ转录的启动子,位于下游,在其基因编码序列内部。这种启动子,根据所转录的RNA的种类,由不同的功能区组合而构成。转录因子识别这些功能区,促进RNA聚合酶转录起始。
18S,5.8S和28S rRNA作为一个转录单位一道转录,产生前体RNA分子。大部分真核生物的18S,5-8S和28S rRNA都是以串联重复排列,每个重复单位被不转录的间隔序列(nontranscribed specer,NTs)所分隔。转录单位的启动子位于NTS中,其功能是和特异的转录因子相结合,促进RNA pol Ⅰ的转录起始。
从孟德尔定律问世以后,人们就知道了生物的各种性状是由基因控制的。一基因一酶学说的建立进一步地明确了基因是以酶的形式通过控制生化反应链来控制的。酶或蛋白和基因又是什么样的关系呢?也就是说遗传信息怎样传递,怎样表达成性状呢?就在Watson和Crick建立DNA双螺旋模型后的第三年,1957年Crick提出了中心法测(central dogma),指出了遗传信息的传递方向:
DNA → RNA→蛋白质
1970年H.Temin和D.Baltimore发现了反转录酶后,Crick对中心法测又作了部分修改:
DNA → RNA →蛋白质
也就是说由DNA通过转录将遗传信息传递给RNA,RNA通过翻译把信息传递给蛋白。通过这种单向的传递,遗传信息通过蛋白质的不同形式,如酶,结构蛋白,运载蛋白,调节蛋白等表达成一种性状。
信使RNA与转移RNA的区别区分mRNA和tRNA,可以从结构和功能这两个方面去把握。
1.结构。
mRNA的一级结构,tRNA的二级、三级结构是经常考察的内容,需要仔细区分。
⑴真核生物的mRNA的5' 端有帽子结构,3' 端为多聚腺苷酸(poly(A))尾巴。
⑵tRNA的二级结构呈三叶草形。三叶草形结构由氨基酸臂、二氢尿嘧啶环、反密码环、额外环和TφC环等5个部分组成。其中,氨基酸臂末端为CCA;反密码环中部为反密码子,由3个碱基组成。反密码子可识别mRNA的密码子。
⑶tRNA折叠形成三级结构。tRNA的三级结构呈倒L形,反密码环和氨基酸臂分别位于倒L的两端。
2.功能。
⑴mRNA是合成蛋白质的直接模板。每一种多肽链都有一种特定的mRNA做模板,因此细胞内mRNA的种类也是很多的。它将DNA上的遗传信息转录下来,携带到核糖体上,在那里以密码的方式控制蛋白质分子中氨基酸的排列顺序,作为蛋白质合成的直接模板。
⑵tRNA的功能是转运氨基酸。在蛋白质合成过程中,tRNA与合成蛋白质所需的单体——氨基酸形成复合物,将氨基酸转运到核糖体中mRNA的特定位置上。
mRNA与反转录以反义RNA为模版,通过反转录酶,进行的RNA转录
1.概念
反转录是以RNA为模板合成DNA的过程,也称逆转录。这是DNA生物合成的一种特殊方式。
2.反转录酶与反转录过程
反转录过程由反转录酶催化,该酶也称依赖RNA的DNA聚合酶(RDDP),即以RNA为模板催化DNA链的合成。合成的DNA链称为与RNA互补DNA(cDNA)。反转录酶存在于一些RNA病毒中,可能与病毒的恶性转化有关。人类免疫缺陷病毒(HIV)也是一种RNA病毒,含有反转录酶。在小鼠及人的正常细胞和胚胎细胞中也有反转录酶,推测可能与细胞分化和胚胎发育有关。
反转录的简要过程表示如下:
3.生物学意义
反转录的发现有重要的理论意义和实践意义。
(1)对分子生物学的中心法则进行了修正和补充,修正后的中心法则表示为:
(2)在致癌病毒的研究中发现了癌基因,在人类一些癌细胞如膀胱癌、小细胞肺癌等细胞中,也分离出与病毒癌基因相同的碱基序列,称为细胞癌基因或原癌基因。癌基因的发现为肿瘤发病机理的研究提供了很有前途的线索。
(3)在实际工作中有助于基因工程的实施。由于目的基因的转录产物易于制备,可将mRNA反向转录形成DNA用以获得目的基因。