! ! "#$%氮吹仪年美国科学家 &’()*+ ,(-./012提出了基因组学(3.4()01+),指对所有基因进行基因组作图(包 括遗传图谱、物理图谱、转录图谱),核苷酸序列分析,基因定位和基因功能分析的一门科学。基因组学包 括两方面的内容:以全基因组测序为目标的结构基因组学( +5/6156/*7 8.4()01+)和以基因功能鉴定为目标 的功能基因组学(964150(4*7 8.4()01+)。基因组学的研究成果对于人类认识自然和人类本身,阐明所有生 物的生命活动的分子基础,具有十分重要的意义。 一、真核生物基因组的特点 !!真核生物基因组与原核生物基因组比较有很大的差异,有其自身的特点,归纳如下。 !!(")真核生物基因组远大于原核生物的基因组,如哺乳类动物基因组 :;<约 = > "?# @A。真核生物 基因组 :;<与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因组是双份的(即 双倍体, -0A7(0-),即有两份同源的基因组。原核生物基因组较小,没有核膜包裹,且形式多样,如大肠杆菌 基因组仅由 B >"?% @A组成,约含 B C??个基因。细菌染色体基因组则常为裸露的环状双链 :;<分子,并 与其中央的 ,;<和支架蛋白构成一致密的区域,
称为类核。 !!(C)真核生物基因占整个基因组的比例很小,基因组中非编码序列远远多于编码序列,非编码序列可 占 $?D E #?D。如哺乳动物约含 =? ???个 E B? ???个基因,只占整个基因组的 FD左右。原核生物的 :;<分子绝大部分用于编码蛋白质,只有一小部分是不翻译的,不翻译区(又称间隔区)通常包含控制基 因表达的序列。病毒基因组具有重叠基因((G./7*AA048 8.4.)的结构,即多个基因在同一 :;<分子上部分 或完全重叠,该 :;<序列能够编码两种甚至三种蛋白质分子;而真核基因组及细菌的基因组没有这种结 构。 !!(=)真核细胞基因转录产物为单顺反子 ),;<,即一个结构基因转录生成一个 ),;<分子,经翻译生 成一条多肽链。原核生物功能相关的几个结构基因常常串联在一起,受一套调控基因的调节,组成操纵子 ((A./(4)结构,并转录生成同一个 ),;<分子,称为多顺反子 ),;<( A(7H10+5/(401 ),;<),作为多种蛋白 质合成的模板。 !!(B)真核生物存在大量重复序列,即在整个基 因组中有许多重复出现的核苷酸序列,重复序列长 短不一,短的仅含两个核苷酸,长的多达数百、乃至 上千个。重复频率也不尽相同:高度重复序列重复 频率可达 "?%次,包括卫星 :;<(散在于基因组中的 图 " C"!反向重复序列 一些小片段的重复序列)、反向重复(04G./5.-/.A.*5) 序列(也称回纹结构,图 " C",见第十三章第二
节)和较复杂的重复单位组成的重复序列;中度重复序列 重复频率为 "?= E"?B次,一些编码区序列如 /,;<基因、 5,;<基因、组蛋白基因等都属于这类重复序列; 单拷贝或低度重复序列,指在整个基因组中只出现一次或很少几次的核苷酸序列,包括编码蛋白质的结构 基因以及基因的间隔序列。重复序列有种属特异性以及个体差异,基因组越大,重复序列越多。 !!重复序列在基因组中可以是串联存在于 :;<分子上,也可以是散布在整个基因组中;可以是编码序 列,也可以是非编码序列。重复序列是由模板序列通过复制、扩增和 I或转座形成,其功能尚不清楚。 !!(F)真核生物的基因是不连续的,其结构基因内部存在许多不编码蛋白质的间隔序列,称为内含子 (045/(4),编码序列则称为外显子( .J(4)。内含子与外显子相间排列,转录时一起被转录下来,然后 ,;< 中的内含子经一定规律的剪接机制被切掉,外显子连接在一起形成成熟的 ),;<,作为指导蛋白质合成的 模板。不同的转录后加工与修饰方式,可以形成不同的 ),;<,翻译出不同的多肽链。原核生物的基因是 连续的,基因内部没有非编码序列。