前沿探索
人类基因组中约98%的遗传物质为非编码DNA,但对这些非编码DNA序列携带的“暗信息”却知之甚少。破译遗传物质的暗信息将为生物学、农学和医学开辟新的领域,为疾病的治疗及诊断方法开启新的纪元。
21世纪之初,在多国科学家的共同努力下,人类基因组草图被成功绘制。“草图”的成功破解得益于人类基因组计划(Human Genome Project, HGP)的实施。HGP计划是由美国科学家于1985年率先提出,并于1990年正式启动,美国、英国、法国、德国、日本和我国科学家共同参与了这一预算达30亿美元的大科学工程。它被誉为生命科学的“登月计划”,与“曼哈顿原子弹计划”和“阿波罗计划”并称为三大科学计划。
然而,科学家们却发现整个人类基因图谱中只有约2%的DNA能够编码蛋白质,而绝大多数的遗传物质是“非编码DNA”,其功能并不清楚,因此有科学家称之为“垃圾DNA”或基因组里的“暗物质”。“垃圾DNA”是20世纪70年代生物学家根据通行的生物进化理论所做出的一个预测。按照这样的预测,人们相信“非编码DNA”序列没有任何功能,不仅对生物体无用,而且可能有害。这样的观念统治了学界长达20年之久,直到20世纪90年代以法尔和梅洛为代表的分子生物学家揭示了部分“垃圾DNA”的神奇功效后,人们才看到了这个巨大宝藏的冰山一角。
为了利用人类基因组计划的大量成果和信息,对人类基因组进行更为全面而详细的结构、功能和调节的注释,美国人类基因组研究所(NHGRI)和欧洲生物信息研究所(EMBL)牵头,于2003年启动了人类DNA元件百科全书(ENCODE)计划。该项目旨在解析人类基因组中的所有功能性元件。它是继人类基因组计划完成之后,又一重要的跨国基因组学研究项目。
ENCODE计划吸引了来自美国、英国、西班牙、日本和新加坡五国32个研究机构的440多名科学家的参与,经过9年的努力获得了迄今最详细的人类基因组分析数据。其阶段性研究结果被整理成30篇论文发表于《自然》《基因组研究》和《基因组生物学》,发现人类基因组内的“非编码DNA”至少80%是有生物活性的,暗藏着重要的生物学信息和功能,而并非之前认为的“垃圾DNA”。无独有偶,加州大学圣地亚哥分校医学院的研究人员在2007年发现,基因组中的“非编码DNA”具有划分基因边界的功能,如同基因组的标点符号,如果没有这些标点符号作为边界元件,基因组的编码部分就如同没有标点的段落。
随着生命科学的飞速发展和生物技术的突飞猛进,尤其是人类基因组计划的完成,昭示着我们已经从基因组时代步入后基因组时代。后基因组工作的推进和发展将使生物工程技术在医疗、农业、药业等相关领域得到广泛应用,造福全人类。2010年12月7日的Science杂志在评选本世纪前10年的十大科学突破时,首先提到的就是基因组中的暗物质(The Genome's “Dark Matter”)。可见,对“非编码DNA”的研究将是后基因组时代重要的科学前沿,因为它有可能揭示一个全新的由非编码遗传物质介导的遗传信息表达调控网络,从而以不同于蛋白质编码基因的角度来注释和阐明人类基因组的结构与功能,也将为人类重大疾病的诊断、干预、防治及药物研发等提供颠覆性的思路与技术。
从基因组、转录组、蛋白质组水平全面认识“非编码DNA”的作用,对于揭示生物发生、发育、进化、遗传变异、疾病等生命现象的本质和机理具有重要的意义。
目前,对于“非编码DNA”的研究还只是刚刚起步,研究进展缓慢,大量的生物学功能和分子机制还有待科学家更系统地研究,其原因之一在于研究难度大。“非编码DNA”不仅容量高、保守性差,而且多以重复序列出现,并具有不稳定性。例如,现有研究证明许多“非编码DNA”的突变与复杂疾病,如关节炎、共济失调症、癌症、自闭症和阿尔茨海默症等的发生息息相关,然而具体的调控机制仍然不清楚。此外,“非编码DNA”领域的基础研究积累和理论支撑不足,并且缺少生物医学信息学复合型人才以及相应的研究手段等等,都制约了“非编码DNA”领域的发展。
分子生物学发展的历史告诉我们,“垃圾DNA”这一错误概念阻碍了科学进步。2006年12月,国际后遗传学会决议否认了“垃圾DNA”一词。该学会创始人安德鲁·伯尼涅兹写信给《科学家》杂志,建议该杂志以公开的方式宣布放弃“垃圾DNA”这个错误的名词。《科学家》杂志的编辑接受伯尼涅兹的建议,并在编者栏写了《垃圾并非废物》一文,认为所谓的“垃圾DNA”,其实是有价值的。由此可见,基因组绝大部分区域仍然潜藏在暗影中,长久以来被人们忽视,只是现在才露出几缕光芒,显示人类基因组的“暗物质”可能蕴藏着与其体积相称的宝藏。
(中国科学院科技战略咨询研究院学部学科研究支撑中心供稿)