一读小说 » 玄幻奇幻 » 虚实乾坤1 » 造人日记4

造人日记4

    基因(遗传因子)是产生一条多肽链或功能RNA所需的全部核苷酸序列。基因支持着生命的基本构造和性能。储存着生命的种族、血型、孕育、生长、凋亡等过程的全部信息。环境和遗传的互相依赖,演绎着生命的繁衍、细胞分裂和蛋白质合成等重要生理过程。生物体的生、长、衰、病、老、死等一切生命现象都与基因有关。它也是决定生命健康的内在因素。因此,基因具有双重属性:物质性(存在方式)和信息性(根本属性)。

    带有遗传讯息的DNA片段称为基因,其他的DNA序列,有些直接以自身构造发挥作用,有些则参与调控遗传讯息的表现。组成简单生命最少要265到350个基因。(这涉及到了基因工作组的力量,人类的基因工作组与果蝇的基本相似)

    在格雷戈尔·孟德尔之前,人们曾认为遗传是一个混合过程,但是孟德尔证实存在一种不可分割和独立的遗传单位,后来人们证实这种遗传单位就是存在于染色体上的基因——一段DNA序列。孟德尔在基因水平上揭示了有性生殖的遗传过程(称之为“分离定律”与“自由组合”定律),虽然他那时并不知道基因的真实存在形式。注意基因和DNA是完全不同的概念。

    基因是控制生物性状的基本遗传单位。

    19世纪60年代,奥地利遗传学家格雷戈尔·孟德尔就提出了生物的性状是由遗传因子控制的观点,但这仅仅是一种逻辑推理。20世纪初期,遗传学家摩尔根通过果蝇的遗传实验,认识到基因存在于染色体上,并且在染色体上是呈线性排列,从而得出了染色体是基因载体的结论。1909年丹麦遗传学家约翰逊(W.Johansen,1859~1927)在《精密遗传学原理》一书中正式提出“基因”概念。

    20世纪50年代以后,随着分子遗传学的发展,尤其是沃森和克里克提出DNA双螺旋结构以后,人们进一步认识了基因的本质,即基因是具有遗传效应的DNA片段。研究结果还表明,每条染色体只含有1~2个DNA分子,每个DNA分子上有多个基因,每个基因含有成百上千个脱氧核苷酸。自从RNA病毒发现之后,基因的存在方式不仅仅只存在于DNA上,还存在于RNA上。由于不同基因的脱氧核糖核苷酸的排列顺序(碱基序列)不同,因此,不同的基因就含有不同的遗传信息。1994年中科院曾邦哲提出系统遗传学概念与原理,探讨猫之为猫、虎之为虎的基因逻辑与语言,提出基因之间相互关系与基因组逻辑结构及其程序化表达的发生研究。

    结构基因

    基因中编码RNA或蛋白质的碱基序列。

    (1)原核生物结构基因:连续的,RNA合成不需要剪接加工;

    (2)真核生物结构基因:由外显子(编码序列)和内含子(非编码序列)两部分组成。

    非结构基因

    结构基因两侧的一段不编码的DNA片段(即侧翼序列),参与基因表达调控。

    (1)顺式作用元件:能影响基因表达,但不编码RNA和蛋白质的DNA序列;

    其中包括:

    启动子:RNA聚合酶特异性识别结合和启动转录的DNA序列。有方向性,位于转录起始位点上游。

    上游启动子元件:TATA盒上游的一些特定DNA序列,反式作用因子可与这些元件结合,调控基因的转录效率。

    反应元件:与被激活的信息分子受体结合,并能调控基因表达的特异DNA序列。

    增强子:与反式作用因子结合,增强转录活性,在基因任意位置都有效,无方向性。

    沉默子:基因表达负调控元件,与反式作用因子结合,抑制转录活性。

    Poly(A)加尾信号:结构基因末端保守的AAUAAA顺序及下游GT或T富含区,被多聚腺苷酸化特异因子识别,在mRNA3′端加约200个A。

    (2)反式作用因子:能识别和结合特定的顺式作用元件,并影响基因转录的一类蛋白质或RNA。

    基因有两个特点:一是能忠实地复制自己,以保持生物的基本特征;二是在繁衍后代上,基因能够“突变”和变异,当受精卵或母体受到环境或遗传的影响,后代的基因组会发生有害缺陷或突变。绝大多数产生疾病,在特定的环境下有的会发生遗传。也称遗传病。在正常的条件下,生命会在遗传的基础上发生变异,这些变异是正常的变异。

    含特定遗传信息的核苷酸序列,是遗传物质的最小功能单位。除某些病毒的基因由核糖核酸(RNA)构成以外,多数生物的基因由脱氧核糖核酸(DNA)构成,并在染色体上作线状排列。基因一词通常指染色体基因。在真核生物中,由于染色体在细胞核内,所以又称为核基因。位于线粒体和叶绿体等细胞器中的基因则称为染色体外基因、核外基因或细胞质基因,也可以分别称为线粒体基因、质粒和叶绿体基因。

    在通常的二倍体的细胞或个体中,能维持配子或配子体正常功能的最低数目的一套染色体称为染色体组或基因组,一个基因组中包含一整套基因。相应的全部细胞质基因构成一个细胞质基因组,其中包括线粒体基因组和叶绿体基因组等。原核生物的基因组是一个单纯的DNA或RNA分子,因此又称为基因带,通常也称为它的染色体。

    基因在染色体上的位置称为座位,每个基因都有自己特定的座位。在同源染色体上占据相同座位的不同形态的基因都称为等位基因。在自然群体中往往有一种占多数的(因此常被视为正常的)等位基因,称为野生型基因;同一座位上的其他等位基因一般都直接或间接地由野生型基因通过突变产生,相对于野生型基因,称它们为突变型基因。在二倍体的细胞或个体内有两个同源染色体,所以每一个座位上有两个等位基因。如果这两个等位基因是相同的,那么就这个基因座位来讲,这种细胞或个体称为纯合体;如果这两个等位基因是不同的,就称为杂合体。在杂合体中,两个不同的等位基因往往只表现一个基因的性状,这个基因称为显性基因,另一个基因则称为隐性基因。在二倍体的生物群体中等位基因往往不止两个,两个以上的等位基因称为复等位基因。不过有一部分早期认为是属于复等位基因的基因,实际上并不是真正的等位,而是在功能上密切相关、在位置上又邻接的几个基因,所以把它们另称为拟等位基因。某些表型效应差异极少的复等位基因的存在很容易被忽视,通过特殊的遗传学分析可以分辨出存在于野生群体中的几个等位基因。这种从性状上难以区分的复等位基因称为同等位基因。许多编码同工酶的基因也是同等位基因。

    属于同一染色体的基因构成一个连锁群(见连锁和交换)。基因在染色体上的位置一般并不反映它们在生理功能上的性质和关系,但它们的位置和排列也不完全是随机的。在细菌中编码同一生物合成途径中有关酶的一系列基因常排列在一起,构成一个操纵子(见基因调控);在人、果蝇和小鼠等不同的生物中,也常发现在作用上有关的几个基因排列在一起,构成一个基因复合体或基因簇或者称为一个拟等位基因系列或复合基因。

    重叠基因是在1977年发现的。早在1913年A.H.斯特蒂文特已在果蝇中证明了基因在染色体上作线状排列,20世纪50年代对基因精细结构和顺反位置效应等研究的结果也说明基因在染色体上是一个接着一个排列而并不重叠。但是1977年F.桑格在测定噬菌体ΦX174的DNA的全部核苷酸序列时,却意外地发现基因D中包含着基因E。基因E的第一个密码子(见遗传密码)从基因D的中央的一个密码子TAT的中间开始,因此两个部分重叠的基因所编码的两个蛋白质非但大小不等,而且氨基酸也不相同。在某些真核生物病毒中也发现有重叠基因。

    断裂的基因也是在1977年发现的,它是内部包含一段或几段最后不出现在成熟的mRNA中的片段的基因。这些不出现在成熟的mRNA中的片段称为内含子,出现在成熟的mRNA中的片段则称为外显子。例如下面这一基因,有三个外显子和两个内含子。在几种哺乳动物的核基因、酵母菌的线粒体基因以及某些感染真核生物的病毒中都发现了断裂的基因。内含子的功用以及转录后的加工机制是真核生物分子遗传学的一个吸引人的课题。

    功能、类别和数目到目前为止在果蝇中已经发现的基因不下于1000个,在大肠杆菌中已经定位的基因大约也有1000个,由基因决定的性状虽然千差万别,但是许多基因的原初功能却基本相同。

    1945年G.W.比德尔通过对脉孢菌的研究,提出了一个基因一种酶假设,认为基因的原初功能都是决定蛋白质的一级结构(即编码组成肽链的氨基酸序列)。这一假设在20世纪50年代得到充分的验证。

    20世纪60年代初F.雅各布和J.莫诺发现了调节基因。把基因区分为结构基因和调节基因是着眼于这些基因所编码的蛋白质的作用:凡是编码酶蛋白、血红蛋白、胶原蛋白或晶体蛋白等蛋白质的基因都称为结构基因;凡是编码阻遏或激活结构基因转录的蛋白质的基因都称为调节基因。但是从基因的原初功能这一角度来看,它们都是编码蛋白质。根据原初功能(即基因的产物)基因可分为:

    ①编码蛋白质的基因。

    ②没有翻译产物的基因。

    ③不转录的DNA区段。

    一个生物体内的各个基因的作用时间常不相同,有一部分基因在复制前转录,称为早期基因;有一部分基因在复制后转录,称为晚期基因。一个基因发生突变而使几种看来没有关系的性状同时改变,这个基因就称为多效基因。

    数目不同生物的基因数目有很大差异,已经确知RNA噬菌体MS2只有3个基因,而哺乳动物的每一细胞中至少有100万个基因。但其中极大部分为重复序列,而非重复的序列中,编码肽链的基因估计不超过10万个。除了单纯的重复基因外,还有一些结构和功能都相似的为数众多的基因,它们往往紧密连锁,构成所谓基因复合体或叫做基因家族。

    等位基因:位于一对同源染色体的相同位置上控制某一性状的不同形态的基因。不同的等位基因产生例如发色或血型等遗传特征的变化。等位基因控制相对性状的显隐性关系及遗传效应,可将等位基因区分为不同的类别。在个体中,等位基因的某个形式(显性的)可以比其他形式(隐性的)表达得多。等位基因(gene)是同一基因的另外“版本”。例如,控制卷舌运动的基因不止一个“版本”,这就解释了为什么一些人能够卷舌,而一些人却不能。有缺陷的基因版本与某些疾病有关,如囊性纤维化。值得注意的是,每个染色体(chromosome)都有一对“复制本”,一个来自父亲,一个来自母亲。这样,我们的大约3万个基因中的每一个都有两个“复制本”。这两个复制本可能相同(相同等位基因allele),也可能不同。下图显示的是一对染色体,上面的基因用不同颜色表示。在细胞分裂过程中,染色体的外观就是如此。如果比较两个染色体(男性与女性)上的相同部位的基因带,你会看到一些基因带是相同的,说明这两个等位基因是相同的;但有些基因带却不同,说明这两个“版本”(即等位基因)不同。

    拟等位基因(pseudoalleles):表型效应相似,功能密切相关,在染色体上的位置又紧密连锁的基因。它们象是等位基因,而实际不是等位基因。

    传统的基因概念由于拟等位基因现象的发现而更趋复杂。摩根学派在其早期的发现中特别使他们感到奇怪的是相邻的基因一般似乎在功能上彼此无关,各行其是。影响眼睛颜色、翅脉形成、刚毛形成、体免等等的基因都可能彼此相邻而处。具有非常相似效应的“基因”一般都仅仅不过是单个基因的等位基因。如果基因是交换单位,那就绝不会发生等位基因之间的重组现象。事实上摩根的学生在早期(1913;1916)试图在白眼基因座位发现等位基因的交换之所以都告失败,后来才知道主要是由于试验样品少。然而自从斯特体范特(1925)提出棒眼基因重复的不均等交换学说以及布里奇斯(1936)根据唾液腺染色体所提供的证据支持这学说之尼,试图再一次在仿佛是等位基因之间进行重组的时机已经成熟。Oliver(1940)首先取得成功,在普通果蝇的菱形基因座位上发现了等位基因不均等交换的证据。两个不同等位基因(Izg/Izp)被标志基因拼合在一起的杂合子以0.2%左右的频率回复到野生型。标志基因的重组证明发生了“等位基因”之间的交换。

    非常靠近的基因之间的交换只能在极其大量的试验样品中才能观察到,由于它们的正常行为好像是等位基因,因此称为拟等位基因(Lewis,967)。它们不仅在功能上和真正的等位基因很相似,而且在转位(transposition)后能产生突变体表现型。它们不仅存在于果蝇中,而且在玉米中也已发现,特别在某些微生物中发现的频率相当高。分子遗传学对这个问题曾有很多解释,然而由于对真核生物的基因调节还知之不多,所以还无法充分了解。

    位置效应的发现产生了深刻影响。杜布赞斯基在一篇评论性文章中曾对此作出下面的结论:“一个染色体不单是基因的机械性聚合体,而且是更高结构层次的单位……染色体的性质由作为其结构单位的基因的性质来决定;然而染色体是一个合谐的系统,它不仅反映了生物的历史,它本身也是这历史的一个决定因素”(Dobzhaansky,1936:382)。

    有些人并不满足于这种对基因的“串珠概念”的温和修正。自从孟德尔主义兴起之初就有一些生物学家(例如Riddle和Chiid)援引了看来是足够份量的证据反对基因的颗粒学说。位置效应正好对他们有利。Goldschmidt(1938;1955)这时变成了他们的最雄辩的代言人。他提出一个“现代的基因学说”(1955:186)来代替(基因的)颗粒学说。按照他的这一新学说并没有定位的基因而只有“在染色体的一定片段上的一定分子模式,这模式的任何变化(最广义的位置效应)就改变了染色体组成部分的作用从而表现为突变体。”染色体作为一个整体是一个分子“场”,习惯上所谓的基因是这个场的分立的或甚至是重叠的区域;突变是染色体场的重新组合。这种场论和遗传学的大量事实相矛盾因而未被承认,但是像Goldschmidt这样一位经验丰富的知名遗传学家竟然如此严肃地提出这个理论这件事实就表明基因学说还是多么不巩固。从20世纪30年代到20世纪50年代所发表的许多理论性文章也反映了这一点(Demerec,1938,1955;Muller,1945;Stadler,1954)。

    复等位基因:基因如果存在多种等位基因的形式,这种现象就称为复等位基因(multipleallelism)。任何一个二倍体个体只存在复等位基中的二个不同的等位基因。

    在完全显性中,显性基因中纯合子和杂合子的表型相同。在不完显性中杂合子的表型是显性和隐性两种纯合子的中间状态。这是由于杂合子中的一个基因无功能,而另一个基因存在剂量效应所致。完全显性中杂合体的表型是兼有显隐两种纯合子的表型。此是由于杂合子中一对等位基因都得到表达所致。

    比如决定人类ABO血型系统四种血型的基因IA、IB、i,每个人只能有这三个等位基因中的任意两个。