2003年4月10日
解读生命密码——人类基因组计划
近一个世纪以来,人类在上天入地的科技发展中取得不少辉煌的成就,在解开微观和宇观的不少秘密之后,对于人类,尚有很多秘密不为自身所知,最大的秘密就在于遗传基因。现在已经知道,基因不仅可以通过复制,把遗传信息传给下一代,还可以使遗传信息得以表达。不同人种的头发、肤色、眼睛、鼻子等有差异,人的行为举止和生老病死等大多受基因支配;几乎每个人,自一生下来就有各种特性发展,甚至各种疾病的倾向,也多是由所携带的基因或基因的某种缺陷所造成的。人体中有5万~10万个基因,其中30%~40%与人类的疾病有关。如果将人类基因组的排序破译,这一切的秘密也将随之揭开。
人类的生命遗传密码就藏在DNA之中。早在1953年,沃森和克里克就发现了DNA的双螺旋结构,看起来,生命的秘密就在其中的4种基本成分——碱基之中。这4种碱基是A(腺嘌呤)、T(胸腺嘧啶)、G(鸟嘌呤)、C(胞嘧啶)。如果说,DNA是本藏有生命遗传密码的“天书”,这4种碱基就是它的基本字母,由这4种基本字母配出“碱基对”,生命的密码就隐藏在“碱基对”的排序之中。“碱基对”的排序是破解生命秘密的关键。但是,在很长时间里,人们始终找不到测定DNA中“碱基对”的排序方法。
人类只有一个基因组,内含5万~10万个基因,它们由30亿个碱基对组成,它们分布在细胞核的23对染色体中。从20世纪六七十年代起,为了破解生命的奥秘,人类就开始探索DNA碱基对排序的征程。这是一个历时很长的曲折过程,它们涉及众多大师级人物,其中包括不少诺贝尔奖得主和众多著名国际研究组织的艰苦卓绝的奋斗过程。
在对基因测序还找不到门路的时候,一位关键人物出现了,他的发现成为解决困境的突破口。他就是英国生物学家弗莱德里克·桑格(Frederick Sanger)(图1)。桑格具有超人的发明天赋。1955年,桑格曾因发明鉴定蛋白质结构的电泳法,获得了1958年诺贝尔化学奖。1975年,在双螺旋结构发现的22年之后,桑格又发明了一种方法,叫做“加减法”,又称为“桑格法”,用于测定DNA序列。这种方法是,先把DNA的链条拆成一段段的小短节,以此为模板,配上一个合适的“引物”,合成与模板互补的DNA链,再把每段的顺序弄清楚。利用这种方法,桑格测出来一些碱基对数目很小的病毒DNA序列。为此,桑格和他的两个合作者获得了1980年的诺贝尔化学奖。桑格是目前世界上唯一获得两次诺贝尔化学奖的科学家。

图1
虽然找到了DNA测序的突破口,但是这种方法法只适用于碱基对较少的病毒类,无法应对人类由几十亿个碱基对构成的DNA。此外,这种方法需要大量相同的DNA复制片段,对于人类的DNA样本很难满足这个要求。正在人们对稍大的DNA束手无策的时候,新的机会出现了。在一种大肠杆菌中,科学家找到了一种特殊的“内切酶”,它可是个“宝贝”,利用它能把特定的DNA切成小片段。这种酶还有另一个好处,经它切过的小片段端头还具有一定的黏性,便于与其他片段黏合而实现“基因重组”。这个意外的发现解决了基因测序上的多个难题。发现这个“内切酶”的是三位生物学家,在图2中左起依次为沃纳·阿伯(Werner Arber)、丹尼尔·纳森(Daniel Nathans)和哈米尔顿·史密斯(Hamilton Smith),他们共同获得了1978年的诺贝尔生理学或医学奖。

图2
进入20世纪80年代,“桑格法”与新发现的“内切酶”法相结合,导致基因测序技术迅速发展,加上蓬勃发展的计算机技术的介入,使DNA的测序时机逐渐成熟。在这块DNA测序的处女地上,人们勤奋地耕耘了起来。仅在20世纪八九十年代这20年间,在生物基因领域获得诺贝尔生理学或医学奖及诺贝尔化学奖的就有16人次。到此时,越来越多的生物基因组被辨识,已经能测出高达10万个碱基对的病毒基因组。在不断取得成功的鼓舞之下,一些科学家开始了一个目标更加长远、任务更加庞大,过去想也不敢想的计划——把人类基因组30亿个碱基对一个一个地检测出来,破解上帝留给人类的这本基因“天书”。
早在1962年,DNA分子双螺旋结构发现者、诺贝尔生理学或医学奖获得者詹姆斯·沃森(James D.Watson)就说过,“世界各国应该意识到,人类基因属于全人类,而不是属于哪一个国家。”这句话的含义是,对于基因的研究,全人类应该“共同耕耘,共享其果”。20年之后证明,沃森的说法非常具有远见。到了1984年,当美国能源部首次把人类基因组测序的计划提上日程时,世界范围的科学家已经陆续测出了总计3700万个碱基对的人类基因序列。看起来,这是一个硕大无比的成果,但实际上,它仅占整个人类基因组的1%。显然,任何人或任何研究团队要想在有限的时间里完成人类的30亿个碱基对测序的目标是绝不可能的。即使有大量的物力和上百亿资金的支持,也绝不是单独个人和某个团体所能完成得了的。
1985年,当世界范围呼唤DNA测序的国际协作时,一位具有魄力的人物出现了,这就是前面所提到的詹姆斯·沃森(图3)。1988年,他开始主持美国国家卫生研究院的工作。首先,他先知卓见地成立一个直接归属卫生研究院领导的基因组研究中心。他一走马上任,就一连召开数次相关科学家的会议,听取各方意见,不到两年,就把基因测序研究的工作推动了起来。1990年10月1日,DNA测序计划由美国国会批准,又从美国能源部争取到了30亿美元的巨额预算,在美国国家卫生研究院的直接领导下,“人类基因组计划”正式启动,随后英国、法国、德国、日本、中国和印度先后加入这个庞大的计划。

图3
人类基因组计划是一个规模宏大、跨国界、跨学科的大规模科学探索工程,原计划在15年内完成。它涉及生物学、物理学、化学、计算机科学、数学和工程学等多个学科,其目的在于测定人类的染色体中所含有的30亿个碱基组成的核苷酸序列,同时绘制出人类基因组图谱,达到破译人类遗传信息的最终目的。这项计划是为了探索人类自身生命奥秘所在迈出的重要一步,也是继曼哈顿计划和阿波罗登月计划之后,人类在科学史上的又一个伟大工程。
到2003年4月10日,人类基因组计划历时13年,这一由美、法、德、日、中、英、印等7国、20个研究所组成的国际协作组织与全球的2800余名科学家携手合作,完成了人类基因组常染色体的大规模测序,确定出人类基因组DNA的30亿个碱基对,破译出了人类全部遗传信息,找到了人类所有基因在染色体中的位置。2006年6月26日,研究组共同宣布,已经成功地获得人类基因的遗传图谱、物理图谱、序列图谱和基因图谱等4项大规模基因组图谱。此时,“人类基因组计划”全部完成。
在人类基因测序方面有中国人的一份贡献。早在1993年,中国就启动了自己的人类基因组测序计划,并在上海、北京成立了南方和北方两个基因组中心,积累了很多基因测序的经验。1999年9月,中国加入国际基因组计划,负责人类3号染色体上的基因测序。其中,南方国家基因组研究中心、北方国家人类基因组研究中心、中国华大基因等15个单位的中国科学家顺利地完成了3000万个碱基对(占人类基因组碱基对总数的1%)的测序和分析工作。2004年4月,中国科学家顺利完成了这3000万个碱基对的测序任务,为人类基因组计划贡献了一部分力量。
人类基因组计划的成功,不仅是在医学、生物学研究上的一场革命,也由此影响可再生能源、产业性生物技术、农业生物科学、环境科学、法医学及国家安全,更促进动物学、生态学、人类学和其他学科的深入发展。
人类基因组计划的成果使人类对疾病有了更新的认识。从实质上说,人类所有的疾病都与基因有关,因此都属于基因病:其中包括如白化病、血友病、色盲等单基因病;也包括如肿瘤、心脑血管病、高血压、糖尿病等这样的多基因病;还包括艾滋病、乙肝等获得性基因病。也就是说,不管各种疾病多么五花八门,不管人类生命过程中的生、老、病、死是多么复杂的经历,它们的绝大多数都含有遗传信息,它们的发生、发展都体现在基因机理的环节上。因此,只有从人类基因组的整体水平上,才可以找到最佳的治疗方案,在诸如保健、环境、营养、防病、治病,甚至对付疑难病症等方面都有望在基因组的水平上找到解决办法。
此外,人类基因组所表现出来的遗传信息、生物信息等都可以转变为光电信号,这样可以使对基因的研究和应用实现产业化。例如,材料工业可以根据基因组的信息发展纳米技术,研制生物材料、生物芯片,发展组合化学等,这些技术在药物和临床等应用上有广阔的前途。
值得注意的是,对于生命现象,基因并非唯一的因素,任何生命现象归根到底都是基因与环境相互作用的结果。过于强调基因,会走向基因决定论的歧途。此外,对基因研究也应设置合理的伦理规范,否则基因研究有可能导致制造种族灭绝性的基因武器。但这些都不能成为基因研究的桎梏,相信人类出于生存和生活的本能和理智,在任何科技活动中,都会按照一定的程序进行,并经常调节和规范自己的行为。
关键词:人类基因组计划,The human genome project
图1:https://www.google.ca/?gfe_rd=cr&ei=w-8plVfSLFYuN8QeR4YDgAw&gws_rd=ssl#q=Fred-erick+Sanger