逍遥学能 2017-05-08 17:00
12月30日,国家基因库一期工程封顶仪式在深圳举行,这标志着我国生物产业的战略性发展向前迈进了关键的一步。
国家级基因库
近年来,美国、欧盟、日本等发达国家已将保护基因资源列入本国战略计划,分别建立了国家级的基因数据库(NCBI、EMBL和DDBJ)和层次不同的生物样本资源库。而我国生命科学和生物产业虽发展迅速,但大量的生物样本和基因数据的收集,保存、分类管理以及应用尚不规范,因此,需要建立技术领先、标准规范、共享服务、安全可靠的国家级基因库。
深圳国家基因库是我国推动生物产业发展和基因技术研究的重大科技基础设施,着眼于为本国生命科学研究和生物产业发展提供基础性和公益性服务平台,储存和管理我国特有的遗传资源、生物信息和基因数据,是具有国家水平、服务国家战略需求的公益性创新科研和产业基础项目。作为中国第一个国家级基因库,截止目前已累计处理了近300万份生物样本。
生物谷联系到了深圳华大基因研究院、国家基因库的研究员张勇博士。张勇研究员向我们介绍道,国家基因库采用资源样本库,生物信息库以及生物资源信息网络(联盟)相结合的运营模式,统筹规划、管理和利用遗传资源和生物信息。
资源样本库用于储存和管理珍贵的各类生物样本(来源于人,动、植物,微生物等),保护我国特有的遗传资源,为健康、农业、材料等生物产业产品研发项目提供全面专业的样本资源。
生物信息库储存和分析重要物种全部相关数据(包括基因组学,转录组学,蛋白组学,代谢组学等以及表型信息或临床信息数据),为国家重大战略规划中相关议题的研究论证与决策制定,提供科学的基础数据服务。
生物资源信息网络着力于整合国内乃至国际生物资源,搭建覆盖广泛的生物资源和生物信息网络联盟平台,促进信息和人才的交流、促成基于样本资源的的合作,促进样本资源的使用和开发,推动相关科研工作的开展和产业转化。
大数据技术助力基因库建设
2007年以来,随着第二代测序技术的兴起,生命科学已经从过去传统的实验性科学转向大数据科学。仅2010年的生物数据产出量是过去所有生物数据产出的10倍。测序技术飞速发展,使得人类基因组测序的成本不断下降,开展百万人的基因测序逐渐成为可能。按一个人30倍覆盖度计算(约100GB的原始基因测序数据),加上各类分析以及不同样本、时间点的数据,一个人的数据将达到1TB。大数据时代的到来意味着数据存储、传输、分析、应用的挑战,同时也意味着人类通过大数据进一步了解健康、生命数字化的时代向我们走来。
张勇研究员透露,国家基因库已经与国家超级计算天津中心、国家超级计算深圳中心、国家超级计算广州中心等机构展开战略性合作。目前基因库自身已拥有存储能力达到40PB,总峰值计算能力达到每秒212万亿次,并拥有云存储技术,为海量生物资源表型数据及组学数据提供存储、处理和分析支撑。
依托雄厚的计算机、网络硬件基础,国家基因库已经实现诸如:存储海量生物基因数据;提供生物信息检索、比较、分析;提供生命科学研究平台,支撑各类基于数据的信息分析流程的开发和运行等服务,力求打造集科研、技术、产业、教育的生态系统。
国家基因库目前拥有四十多个参考基因组数据库,包含近千种动物、植物、微生物基因组,占全球已完成大型基因组数量的80%以上,涵盖基因组、转录组、蛋白质组、表观组等多组学数据以及表型数据和临床数据信息。其中人方向的数据库包括:首个亚洲人基因组数据库、两千多种单基因遗传病数据库、中国肿瘤基因组(CCGC)数据库、海啸DNA数据库、人肠道菌群数据库等。
未来的发展和成果转化
张勇研究员表示,到深圳国家基因库将建立国际一流的高效基因信息数据库,可溯源性生物样本资源库,完成3000万份可溯源性生物样本保存,实现对基因信息数据总量达1EB的访问支持。同时,围绕生物医学,生物农业和海洋生物等生物产业重点领域搭建基因信息资源挖掘的基础性支撑平台,全面提升我国生物产业的创新能力。
国家基因库将为动植物育种、生态环境保护以及临床检验科学、转化医学、个体化医疗等产业发展提供全面支撑。
在新型农业方面,动植物分子育种、功能基因的发掘、新能源的开发利用等,需要基于大量物种资源,搭建大型基因型和表型数据库,为育种者和开发者提供完整的信息指导,加快育种和开发的过程。
通过收集和保存各种有价值的动植物种质资源,建立大规模的资源库或保护区,保护物种的多样性,通过深入研究外界环境和生物之间的相互作用,对生态环境起到保护和检测作用
国家基因库还将为数字健康管理、临床检测,疾病防治及生物制药等提供大量样本数据的支撑,确保其针对性和准确率,便于验证技术的可靠性,并可利用大数据,在充分考虑人群差异的情况下,确定最佳策略。
1月22日,来自华大基因研究院、国家基因库的张勇研究员将出席"(第二届)生物样本库与临床研究论坛"。届时,张勇研究员将详细介绍国家基因库的建设情况,并就如何在样本库之上搭建、运营大数据平台,以及由此带来的对临床研究和应用的推动作用进行详细的分析和讨论。