RNA的转录合成从化学角度来讲类似于DNA的复制,多核苷酸链的合成都是以5’→3’的方向,在3’-OH末端与加入的核苷酸磷酸二酯键,但是,由于复制和转录的目的不同,转录又具有其特点:(1)对于一个基因组来说,转录只发生在一部分基因,而且每个基因的转录都受到相对独立的控制(图17-2);(2)转录是不对称的。(3)转录时不需要引物,而且RNA链的合成是连续的。
真核和原核细胞内都存在有DDRP,迄今发现的DDRP的有以下特点:①以DNA为模板;在DNA的两条多苷酸链中只有其中一条链作为模板,这条链叫做模板链(templatestrand),又叫做无意义链。DNA双链中另一条不做为模板的链叫做编码链,又叫做有意义链,编码链的的序列与转录本RNA的序列相同,只是在编码链上的T在转录本RNA为U,由于RNA的转录合成是以DNA的一条链为模板而进行的,所以这种转录方式又叫做不对称转录。②都以四种三磷酸核苷的底物,原料;③都遵循DNA与RNA之间的碱基配对原由,A=U,T=A,C=G,合成与模板DNA序列互补的RNA链。④RNA链的延长方向是5’→3’的连续合成。⑤需要Mg2+或Mn2+离子。⑥并不需要引物。RNA聚合酶缺乏3’→5’外切酶活性,所以没有校正功能。
图17-2 细菌染色体上几个基因转录的方向及所用模板
RNA聚合酶催化下列反应:
大肠杆菌RNA聚合酶的研究得比较透彻的,这是一个分子量达50多万,全酶由五咱亚基组成,去掉δ亚基的部分称为核心酶,核心酶本身就能催化苷酸间磷酸二酸键形成。利福平和利福霉素能结合在β亚基上而对此酶发生强烈的抑制作用。β亚基似乎是酶和核苷酸底物结合的部位。细胞内转录是在DNA特定的起始点上开始的,δ亚基的功能是辨认转录起始点的。β’亚基是酶与DNA模板结合的主要成分。α亚基可能与转录基因的类型和种类有关。
表17-1 大肠杆菌RNA聚合酶
亚单位 | 分子量 | 亚单位数目 | 功能 |
α β β δ | 36512 150618 155613 70263 | 2 1 1 1 | 决定哪此基因被转录 与转录全过程有关 结合DNA模板 辨认起始点 |
真核生物中已发现有四种RNA聚合酶,分别称为RNA聚合酶Ⅰ、Ⅱ、Ⅲ和线粒体RNA聚合酶,分子量大致都在50万道尔顿左右,它们专一性地转录不同的基因,因此由它们催化的转录产物也各不相同。RNA聚Ⅰ合成RNA的活性最显著,它位于核仁中,负责转录编码rRNA的基因。而细胞内绝大部分RNA是rRNA是RNA。RNA聚合酶Ⅱ,位于核质中,负责核内不匀一RNA的合成,而hnRNA是mRNA的前体。RNA聚合酶Ⅲ负责合成tRNA和许多小的核内RNAs。鹅膏蕈碱是真核生物RNA聚合酶特异性抑制剂,三种真核生物RNA聚合酶对鹅膏蕈碱的反应不同,见表17-2,原核生物靠RNA聚合酶就可完成从起始、延长、终止的转录全过程,真核生物转录除RNA聚合酶外还需另一此叫做转录因子的蛋白质分子参与转录的全过程,见后叙。
表17-2 真核生物的RNA聚合酶
种类 | 分布 | 合成的RNA类型 | 对α-鹅膏蕈碱的敏感性 |
Ⅰ Ⅱ Ⅲ Mt | 核仁 核质 核质 线粒体 | rRNa hnRNA tRNA,5sRNA 线粒体RNAs | 不敏感 低浓度敏感 高浓度敏感 不敏感 |
转录的主要过程见图17-3,为研究和叙述方便,可将RNA合成分为识别与起始、延长和终止三个阶段。
图17-3 转录的主要过程
转录是从DNA分子的特定部位开始的,这个部位也是RNA聚合酶全酶结合的部信这就是启动子。为什么RNA聚合酶能够仅在启动子处结合呢?显然启动子处的核苷酸序列具有特殊性,为了方便,人们将在DNA上开始转录的第一个碱基定为+1,沿转录方向顺流而下的核苷酸序列均用正值表示;逆流而上的核苷酸序列均用负值表示。
对原核行物的100多个启动子的序列进行了比较后发现;在RNA转录起始点上游大约-10bp和-35bp处有两个保守的序列,在-10bp附近,有一组5’-TATAATpu的序列,这是Pribnow首先发现的称为Pribnow框,RNA聚合酶就结合在互部位上。-35bp附近,有一组5’-TTGACG-的序列;已被证实与转录起始的辨认有关,是RNA聚合酶中的δ亚基识别并结合的位置。-35序列的重要性还在于在很大程度上决定了启动子的强度。
由于RNA聚合酶分子很大,大约能覆盖70bp的DNA序列,因此酶分子上的一个适合部位就能占据从-35到-10序列区域(图17-4)。
图17-4 Structure of the prokaryotic promoter region.
真核生物的启动子有其特殊性,真核生物有三种RNA聚合酶,每一咱都有自己的启动子类型。以RNA聚合酶Ⅱ的启动子结构为例,人们比较了上百个真核生物RNA聚合酶Ⅱ的启动子核苷酸序列伯发现;在-25区有TATA框,又称为Hogness框或Goldberg-Hogness框。其一致序列为T28A97A93A85A63T37A83A50T37,基本上都由A,T碱基所组成,离体转录实验表明,TATA框决定了转录起点的选择,天然缺少TATA框的基本可以从一个以上的位点开始转录。在-75区有CAAT框,其一致的序列为GGTCAATCT。有实验表明CAAT框与转录起始频率有关,例如缺失GG,兔子的β珠蛋白基因转录效率只有原来的12%(图17-5)。
图17-5 Eukaryotic gene promoter sequences
除启动子外,真核生物转录起始点上游处还有一个称为增强子的序列,它能极大地增强启动子的活性,它的位置往往不固定,可存在于启动子上游或下游,对启动子来说它们正向排列和反向排列均有效,对异源的基因也起到增强作用,但许多实验证实它仍可能具有组织特异性,例如免疫球蛋白基因的增强子只有在B淋巴细胞内活性最高,胰岛素基因和胰凝乳蛋白酶基因的增哟子也都有很高的组织的特异性。
在原核生物中,当RNA聚合酶的δ亚基发现其识别位点时,全酶就与启动子的-35区序列结合形成一个封闭的启动子复合物。由于全酶分子较大,其另一端可在到-10区的序列,在某种作用下,整个酶分子向-10序列转移并与之牢固结合,在此处发生局部DNA12-17r 的解链形成全酶和启动子的开放性复合物。在开放性启动子复合物中起始位点和延长位点被相应的核苷酸前体充满,在RNA聚合酶β亚基催化下形成RNA的第一个磷酸二酸键。RNA合成的第一个核苷酸总有GTP或ATP,以GTP常见,此时δ因子从全酶解离下来,靠核心酶在DNA链上向下游滑动,而脱落的δ因子与另一个核心酶结合成全酶反复利用。
图17-6 转当起始复合物的模式
真核生物转录起始十分复杂,往往需要多种蛋白因子的协助,已经知道,在所有的细胞中有一类叫做转录因子的蛋白质分子,它们与RNA聚合酶Ⅱ形成转录起始复合物,共同参与转录起始的过程。
真核生物基因中,有专门为蛋白质编码的基因,这些基因由RNA聚合酶Ⅱ负责进行转录起始关键性作用。根据这些转录因子的作用特点可大致分为二类;第一类为普遍转录因子它们与RNA聚合酶Ⅱ共同组成转录起始复合物,转录才能在正确的位置上开始。普遍转录因子是由多种蛋白质分子组成的,其中包括特异结合在TATA盒上的蛋白质,叫做TATA盒结合蛋白,还有至成一组复合物叫做转录因子ⅡD。TFⅡD再与RNA聚合酶Ⅱ结合完成转录起始复合物的形成。(图17-6)
除TFⅡD以外,在细胞核提取物中还发现TFⅡA,TFⅡF,TFⅡE,TFⅡH等,它们在转录起始复合物组装的不同阶段起作用,像TFⅡH就有旋转酶活性,它可利用ATP分解产生的能量,介导起始点双螺旋的打开,使RNA聚合酶得以发挥作用。从中也不难看出真核细胞中基因转录的起始是基因的表达调控的关键,这么多蛋白质分子之间相互作用,以及这些蛋白质分子DNA调控无件相结合,构成控制基因转录开始的复杂体系。
第二类转录因子为组织细胞特异性转录因子或者叫可诱导性转录因子,这此TF是在特异的组织细胞或是受到一些类固醇激素,生长因子或其它刺激后,开始表达某些特异蛋白质分子时,才需要的一类转录因子。
例如:激活剂蛋白-1就是一类可诱导的转录因子,它是由多蛋白质成份组成的复合物,可发由fos基因和jun基因家庭的蛋白质产物组成。当某些生长因子细胞因子和某些化学物质在细胞外刺激这些细胞时,使细胞内JUN蛋白和FOS蛋白发生磷酸化,特异地结合到c-jun基因和c-fos基因的启动子部位,使这些基因转录并翻译出相应的c-JUN蛋白和c-FOS蛋白,这些蛋白质就可组成二聚体的AP-1,AP-1就会结合到细胞核中靶基因的调控部位,促进或激活靶基因的转录活性,产生出由于细胞外刺激因素作用下,这些细胞做出的特异反应一表达出的特异蛋白须分子。有关详细内容见信号转录一章。
RNA链的延长靠核心酶的催化,在起始复合物上第一个GTP的核糖3’-OH上与DNA模板能配对的第二个三磷酸核苷起反应形成磷酸二酯键。聚合进去的核苷酸又有核糖3’-OH游离,这样就可按模板DNA的指引,一个接一个地延长下去。因此RNA链的合成方面也是5’--3。由于DNA链与合成的RNA链具有反平行关系,所以RNA聚合酶是沿着DNA链3’--5’方向移动。整个转录过程是由同一个RNA聚合酶来完成的一个连续下断的反应,转录本RNA生成后,暂时与DNA模板链形成DNA·RNA杂交体,长度约为12个碱基对,形成一个转录泡(图17-7)。转录速度大允是每秒钟30-50个核苷酸,但并不是以恒定速度进行的。在电子显微镜下观察转录现象,可以看到同一DNA模板上,有长短不一的新合成的RNA链散开成羽毛状图形,这说明在同一DNA基因上可以有很鑫的RNA聚合酶在同时催化转录,生成相应的RNA链。而且较长的RNA链上已看到核糖体附着,形成多聚核糖体。说明某些情况下,转录过程未完全终止,即已开始进行翻译。
图17-7 Diagrammatic representation of DNA transcription by E.coli RNApolymerase.The polymerase unwinds a stretch of DNA about 17base pairs in lengthforming a transcriptional bubble thatprogresses along thd DNA.The DNA has tounwind ahead of the polymerase and rewind behind it .The newly formed RNA formsa RNA-DNA double helix about 12 bae pairs long.
转录的延长阶段,原核生物与真核生物之间没有太大差别。
转录是在DNA模板某一位置上停止的,人们比较了若干原核生物RNA转录终止位点附近的DNA序列,发现DNA模板上的转录终止信号有两种情况,一类是不依赖于蛋白质因子而实现的终止作用,另一类是依赖蛋白质辅因子才能实现终止作用,这种蛋白质辅因子称为释放因子,通常又称ρ因子。两类终止信号有共同的序列特征,在转录终止之前有一段回文结构,回文序列是一段方向相反,碱基互补的序列,在这段互补序列之间由几个碱基隔开,不依赖ρ因子的终止序列中富含G·C碱基对,其下游6-8个A;而依赖ρ因子的终止序列中G·C碱基对含量较少,其少游也没有因固定的特征,其转录生成的RNA可形成二级结构即柄一噜噗结构,又称发夹结构,这样的二级结构可能与RNA聚合酶某种特定的空间结构相嵌合,阻碍了RNA聚合酶进一步发挥作用(图17-8)。除DNA模板本身的终止信号外,在入噬菌体中,发现一些蛋白质有协助RNA聚合酶跨越终止部位的作用,叫做抗转录终止蛋白,例如入噬菌体的N基因产物。
图17-8 原核生物转录作用的终止信号
真核生物由于RNA转录后很快就进行了加工,因此很难确定原初转录物的3’末端。病毒SV40的终止位点经过研究发现,很像大肠杆菌的不依赖ρ因子的终止子,转录后的RNA可形成一个发夹结构,3’末端带有一连串的U。爪蟾5sRNA的3’末端有4个U,它们前后的序列为富含G·C的序列,这是所有真核生物RNA聚合酶Ⅲ转录的终止信号。这种序列特征高度保守,从酵母到人都很相似,任何改变这种序列特征的突变都将导致转录终止位置的改变。