从“土匪”到“教父”国家基因库的前世今生
文/记者 李鹏
▲外形酷似“哈尼梯田”的国家基因库
日前,依托华大基因研究院组建的深圳国家基因库正式运营。十几年来,带有民营科研血统的华大,如何“野蛮”生长为国字头基因库?
2011年年底,乔布斯去世不久,当时还不算华大基因一员的朱岩梅在新西兰颠簸的海船上读《乔布斯传》,“他们特立独行,他们桀骜不驯,他们惹是生非,他们格格不入……你可以认同他们,颂扬他们,反对或诋毁他们,但唯独不能漠视他们……只有那些疯狂到认为自己能改变世界的人……才能真正改变世界。”读到这段著名的广告语时,她给华大基因董事长汪建发短信,说这就是形容华大基因团队的。
《乔布斯传》中的描述的确和华大基因很有一些相似。它一向在业界特立独行,不管是它还是其当初的创始人,这些年来一直处于中国科学界尤其是生物科学界的风口浪尖。他们从来不按常规的套路出牌,常常也“不守规矩”。
但谁都无法否认的是,它聚集起了一支规模庞大、又年轻的生物科学家团队。而这几年,他们又开始搞世界规模最大的国家基因库项目,并得到了国家相关部门的认可和支持。
深圳大鹏新区的“哈尼梯田”
有人说生命是一首诗,构成诗的语言结构很简单:ATCG(四种含氮碱基)。这四个字母构成了我们的DNA,传承了地球上大概870万的高等物种。再形象一点解释吧!基因是一篇文章,但是里面的汉字只有4个,它们就是ATGC,可文章长短不同和文字不同,造成了文章的不同,结果就造成生物的多样性。这个生命语言漂亮得就像“E=mc2”一样简洁而美丽。我们每个人都希望自己能够生得优,病得少,活得长,走得安。那就得了解了解这个国家基因库了!
历时5年建设,依托华大基因研究院组建、位于深圳大鹏新区沙片区禾塘仔地块的首个国家基因库9月22日开始运营。北京科技报社记者实地探访看到,这里依山傍海,环境优美,更为重要的是还是个僻静之所,但市区也只有大概半个小时的车程,既能满足国家基因库建设较高的环境要求,也能够充分享受交通之便。
国家基因库占地面积超过5万平方米,建筑总面积11.6万平方米。其中I期建筑面积4.75万平方米。其整体外观仿造了梯田造型,将自然生态的原有面貌和建筑本身的功能性需求融合在一起,打造了一个与外界相对独立的建筑,这里层层梯田种植屋面,混凝土本色与垂直绿化结合的生态外墙让人似乎走入了一个未来的幻想世界。
华大基因董事长汪建透露,早在2003年,还在发展初期的他们就想搞一个基因库,但是却因为种种原因被停掉,他们的梦想只能暂时被搁置起来。
曾经一直饱受制度的束缚
新世纪初,世界正在迎来基因科学研究的大爆发期。刚刚成立不久的北京华大基因研究中心已经在世界生物学界崭露头角。
2003年4月16日,华大基因研究中心发现了SARS病毒的基因组序列,前后过程仅仅用了不到38个小时,而国外却用了一个月的时间。
2003年4月19日,胡锦涛总书记视察了华大基因。该年11月,中编委批准在原中科院遗传所人类基因组中心基础上,成立中科院北京基因组研究所,华大基因的创始人中,2007当选为中国科学院院士的杨焕明任所长,汪建是副所长之一。
数年的时间里,1999年7月脱胎于此前一年8月刚刚成立的中科院遗传所人类基因组研究中心的华大基因一直在制度的漩涡中纠结。它一会儿以中科院基因组生物信息学中心的身份代表政府机构,一会儿又以华大基因中心的名义自称民营公司。华大基因是一家非营利的民营公司,而中科院则代表政府机构。参与商业性较强的项目时华大写在前面,后面是“暨中科院基因组生物信息学中心”,如果公益性强,则把“暨”的两端做一个调换。但是身份的难题常常给其行动带来困扰。
也正是在这种公私不明,加上2007年公有收编的纠结中,华大基因最终发生了分裂。2007年,在杨焕明的支持下,现华大基因董事长、公司创始人之一汪建带着主力部队南下深圳另起灶炉,成立了深圳华大基因研究院。2008年初,杨焕明被免去中科院北京基因组研究所所长职务以后,由于其已经当选为院士,则开始逐步从华大基因的经营管理中淡出。
在深圳落脚的华大基因随后迅速实现野蛮生长,并在几年的时间里就完成了从“土匪”到“教父”的蜕变。在这种转变过程中,汪建又燃起了筹建国家基因库的梦想。
由于在基因检测方面进展迅速,经过不停地游说和申报以后,2011年1月,国家发展改革委员会批复,依托深圳华大基因研究院组建深圳国家基因库。这意味着深圳国家基因库5年以前就拿到了国家的“尚方宝剑”。
这部电影足足要看上4万年
在西方神话中,诺亚建造了一艘方舟,带着各种牲畜、鸟类等,躲避了大洪水,安然度过“世界末日”。一粒种子、一个细胞、一管血液、一口唾沫、一段脱氧核糖核酸、一条数据……这些不起眼的“现在”可能是构建未来生物科技和产业的砖石。
目前,深圳国家基因库样本库现已实现3000万份可溯源、全类型样本存储能力。这里的生物信息数据库也是信息量惊人。国家基因库基于“大数据共享”的理念开发生物大数据时代的搜索引擎,目前这里的统一检索系统已经整合了超过7千个物种/品种、27个人种、7万个样本、百万个基因、千万突变信息和关联1PB的原始数据量,实现总的可检索条目数要超过一个亿。这里的生物活体库则致力于打造成为中国诺亚方舟,保护和保存世界约30万种植物、百万种动物、近千万种微生物活体资源。同时,生物活体库将存储健康大人群的全生命周期细胞资源。
国家基因库目前总数据产量将达到每年5PB,这样的数据规模究竟有多大?“如果把国家基因库也当作一部高清电影,以一部高清电影4GB、时长1.5小时计算,这部电影足足要看上4万年。”国家基因库的一位负责人如此形容。
帮助治疗罕见病成为我们的“基因银行”
对我们普通老百姓而言,国家基因库的一个重要意义就是对罕见病的治疗。现在中国每天大概有1700万的新生儿出生,其中有5.6%的孩子有出生缺陷,可能是唐氏综合征,可能是地中海贫血,也很可能是其他的单基因疾病。我们现在所面临的重大问题,就是如何让孩子变得更加健康?
国家基因库执行主任徐讯表示,对我们个人而言,国家基因库可以从基因数据上实现集中管理和追本溯源,“比如有一些罕见病的家族,他们对自己的疾病基因很关心,他们希望通过努力能够让大家关注这些疾病,但是以前没有一个这样的组织能够把这些疾病的信息和样品集中起来管理,能够同时把他们链接到科研机构、科研团队。我们后面会发起一系列的科研志愿者的活动,其中就包括了很多罕见病的项目,大家都能贡献样品,能引起全世界科学家的重视,大家都能去参与这个疾病的研究,这样就很有希望能发现这些罕见病、未知原因疾病到底该怎么治疗、诊断,这既对个人有意义,同时对整个科研界也有意义。”
国家基因库对个人的另一重重要意义是对我们细胞样品的保存,我们每个人都可以有“基因银行”。国家基因库作为公共平台,提供包括干细胞和免疫细胞保存的平台,一方面可以利用于科研和药物等的开发应用,另一方面如果个人使用,也能具有“银行”的功能。
▲中国首个国家级基因库运营,已存1000 万份样本
汪建火爆回应非议和质疑
随着深圳国家基因库的正式运营,个性突出、时常处于风口浪尖的华大基因掌门人汪建也释然了!
“我们国家喊了这么多年,终于有了自己的基因库”“现在10年过去了,终于又建立起来了。”汪建说这是一个生命的银行,百年回头看将会知道它的价值。
这些年华大基因做了很多基因测序工作,包括参与全球的科学项目,但是在行业中一直面临很多非议和质疑。知名科普作家方舟子2000年11月12日就撰文指出“基因组的测定虽然能够成为遗传学研究的有用工具,但它本身在学术上的意义并不大,是没有多少创造性可言的技术活,基本工作都是通过仪器自动进行的,关键是要有钱买机器,对人才的素质要求不高,不宜夸大测序的学术成就。”“DNA测序方法是外国发明的、仪器是美国生产、试剂是美国的,具体课题无需很多ideas,用中国的大量的钱(包括初期用地方政府的钱)、用中国廉价劳力,大量测序,是否算好的科学,生物学界很多人自有看法。”2012年10月,北京大学生命科学院教授饶毅在北京大学的一场学术论坛上,也如此向与会的时任华大基因执行总裁王俊“开炮”。
在很多批评者看来,华大不过是科学水平不高、依赖测序仪器和人海战术的“测序工厂”,相当于“生物界的富士康”。汪建并不否认外界对华大基因的质疑。“15年前人家说华大做的是垃圾,一群民工做的垃圾工作。”但是他表示,他们跟大家最大的分歧就是存在就是合理,而对这样的基因研究如果分解成一个工序,华大基因是最高效的。
▲国家资源库储存的种质资源
近些年来,随着华大基因科研实力的猛增。外界对华大科研能力的质疑汪建很有一些不服气了。“华大基因离开北京到深圳来9年时间发表了200篇文章在《自然》《科学》上,这足以证明华大基因的研究能力。”他说。
这倒没有吹牛。统计显示,截至2016年5月5日,华大基因到深圳以后9年间已发表论文1412篇,平均约两天即有一篇论文发表,其中在《自然》(Nature)及子刊杂志就发表论文171篇、在《科学》发表29篇。其中仅在2015年,华大基因就发表文章374篇,其中在《自然》与《科学》系列期刊发表文章42篇。
带动华大基因实现新的蜕变
也正是有了这样的科研成绩。汪建在各种场合总是牛气冲天,个性张扬,就是媒体记者的提问,要是不对他的胃口,就会遭受抨击。事后,总是其下属出来打圆场,说汪总性格就是这样。
汪建这位湖南人插过队,留过学。20多年前,在得知国际人类基因组计划启动后,他就开始想象自己和它的关系。1999年杨焕明和汪建等人创立华大基因,并自作主张地宣布“代表”中国加入国际人类基因组计划,他们还自己搞起水稻基因组测序等大项目。这让政府后来掏的钱加起来数以亿计。因此,这些年来业界很多人一直认为是他们当年“绑架了政府”。
“我们就是一群土匪。”汪建事后也自己也如此表示。
有人说,当年不守规矩的汪建像土匪一样横冲直撞地开始了他的创业,他的身上生长着“土匪”的基因。如今,华大基因作为中国最牛的生物技术公司,依旧在蛮横地发展。
随着国家基因库的正式运营,一直处在风口浪尖的华大基因及国家基因库实现了新的蜕变。“也许我们没有那么强的研发力量,也许我们对很多事情的认识比较肤浅,但我们有本事拿出所有信息,挖掘信息并整理好,请专家、学者从整理好的信息中提炼出科学问题。”现在,显然国家基因库给汪建提供了新的底气。
深圳国家基因库主任梅永红表示,此次开业仪式是深圳国家基因库发展的一个里程碑,国家基因库将融合近年来生命科学学科的国际前沿动向,扮演好公共服务平台的角色,形成从资源到科研、产业的全贯穿全覆盖的模式,实现大资源、大数据、大科学、大产业的联动,这对我国基因科学乃至整个生命科学的发展都具有深远意义。■