自人类基因组计划完成以来,以美国为代表,世界主要发达国家纷纷启动了生命科学基础研究计划,如国际千人基因组计划、DNA百科全书计划、英国十万人基因组计划等。这些计划引领生物数据呈爆炸式增长,目前每年全球产生的生物数据总量已达EB级,生命科学领域正在爆发一次数据革命,生命科学某种程度上已经成为大数据科学。

  “这还只是刚刚开始”,王亚东强调,“随着测序技术在医疗、健康、医药、环境、能源等相关领域的广泛应用,人类将面临生物数据的海洋,其将成为这些领域创新的源泉,对这些数据创新性的管理和应用,将为生命科学及相关产业领域带来一次新的革命。”

  与全球蒸蒸日上的生物大数据创新发展热潮相比,中国的研发及应用才拉开帷幕。“我们与国际前沿技术水平至少相差30年,差距主要表现在数据分析、数据管理和与临床的应用对接上”,上海生物信息技术研究中心主任李亦学研究员对此深表担忧。