关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

解密“全球最大测序机构”华大基因

2013.4.15

banquan2.jpeg

  在深圳,背靠盐田青翠的北山,有这样的一家基因测序机构,基因测序规模在全球达到最大。

  它是华大基因。有人说它会是下一个华为,下一个腾讯。

  它的员工平均年龄不到27岁,每个月平均却有3份学术论文登上“CNNS(即《Cell(细胞)》、《Nature(自然)》、《NEJM(新英格兰医学杂志)》、《Science(科学)》)”,体量相当于一个院士的毕生科研成就。它把科研做到了极致。

  所有的媒体对它感兴趣,所有的资本对它感兴趣。

  它将发布在国际顶尖科研刊物的代表性学术论文集结在北山工业区11栋7楼展厅,做成一面巨大的“论文墙”。每个人去那里参观,站在科学的下面,自觉很渺小。

  投资人也不够清楚,基因测序是怎么回事?它的商业模式是什么?

  137台测序仪支撑“基因帝国”

  2013年4月10日上午,记者来到了盐田北山道。华大基因就在过了北山道天桥第一个红绿灯右手边的路口。马路旁竖起了一块蓝色底的指示牌,上面的白色字体“BGI”显得尤为显眼。

  “我们这边以前是个鞋厂,老板跑路了,我们就把这个地方租了下来进行了改造。”华大基因工作人员告诉记者。

  附近过往的路人也许知道这是BGI,也有人知道它是华大基因,但是他们多数并不清楚,华大基因究竟是在做什么的公司。极少的人能知道,这是一家基因测序机构,甚至是全球最大的基因测序机构。

  从1楼的总服务台上去,你将看到2楼是做生物信息分析的场所,3楼是健康实验室,4楼是蛋白平台,5楼是核酸平台,6楼是农能平台,7楼是办公场地、实验室和展厅,8楼是办公场所和会议室。也许只有核酸平台这些看似高深的生物名词,才能提醒你这并非传统或常规公司。

  早在20多年前,从得知国际基因计划启动后,华大基因董事长兼总裁汪建就在想象并推近自己与基因测序之间的关系。不过那时候,他可能还想象不到他将拥有一个帝国。

  这个距离的极大缩短,在哈佛大学遗传学家乔治·洽奇口中得到阐述,“1999年,华大基因支持了人类基因组计划的1%,而到今天,华大的基因测序能力让其在世界基因测序上的贡献超出了50%。”

  这是今天华大基因在全球基因领域里的坐标系。据说有人问华大基因CEO、华大基因研究院院长王俊,华大基因是否真的是全球最大最好的基因研究机构,他跳起来反问了,为什么不相信中国可以做出一流的东西。

  “华大基因最核心的就是测序。”前述私募人士表示,2009年第一次登门调研的时候,已认定这一点。

  华大基因可能也认准了这一点。2010年年初,华大基因利用6亿国开行贷款,从美国Illumina公司购买了128台新一代测序仪Hiseq2000。这是华大基因核心竞争力——测序能力的支撑,因而是最重要的资产。

  华大基因内部人士也认为,如果要问华大基因从什么时候开始成为全球规模最大的测序机构,或许就应该从这一时间点算起。随着新机器的到来华大基因迅速扩张,到2012年,其测序产出能力占全球一半以上。

  到2012年9月,华大基因开始收购上游公司CG。“它在技术研发方面有很强的优势,而对华大来说,像测序仪的研发,就是一个很好的互补。”华大基因品牌宣传部部长杨碧澄告诉记者。

  目前华大基因在国内可能已没有势均力敌的对手。“可能在单个的领域里面会有一些做类似工作的机构或公司,可能专注于做无创产前,或是科技服务,而不像华大基因是一个非常多元化的综合体。”4月10日下午,华大基因品牌宣传部部长杨碧澄当面回答记者。

  一位接近华大基因的机构人士告诉记者,“国内同行不好比,A股里面如果硬要说,那就是达安基因和迪安诊断,广州还有个没有上市的金域检测。国外可以比的,韩国有一家Macrogen集团,也是上市公司,做基因检测;美国有一家,就是Illumina公司。”

  2013年4月10日下午,在华大基因总部办公楼5楼,隔着玻璃见到了Hiseq2000测序仪。“一台仪器就相当于一台法拉利的价格,80万美金。128台仪器,深圳总部有20台,香港88台,其余放在其他片区。”工作人员介绍,“后面这个仪器的数目增加到了137台,我们还加上各类的测序仪,像研究蛋白质的质谱仪等。”

  这些仪器是全自动化的。工作人员告诉记者,“上机要走立项,走流程,而且有值班人员24小时上班,以确保机器有没有故障。有时有一些很珍稀的标本,像我们之前做过一个澳大利亚土著人,它就是好几百年前的头发样本,只有这一份样本。所以要确保仪器万无一失。”

  实际上,样本从测序仪测出来还只是一张图谱,还要交给生物信息分析的团队,把图像信号转化为数字信号,然后通过编程或其他计算方式把结果计算出来,才出报告。在华大基因4000人的职工团队里,约有1000人专门从事该类数据分析的工作。

  97086项目与“大科学”

  华大基因在一本28页厚的新宣传手册上,公布了标志性研究成果的精准数据,提示着这个基因帝国的迅速崛起和膨胀。

  在破译重要经济和科研价值的动植物基因组方面,目前华大基因已完成586个物种基因组测序和28200多个变异基因组研究;

  在全面了解人类进化及疾病相关的遗传机制方面,已完成57000多个个体相关基因组测序研究;

  在解析所有环境中的微生物群落基因组方面,已完成6000多个样本的单菌基因组测序和5300多个样本的宏基因组测序。

  换言之,华大基因旗下已积聚了海量的97086项研究成果。

  在这些科研成果背后有个“大科学”概念,是华大基因在总部展览厅里挂出的大目标之一,意思是用科研带动科技应用。汪建不止一次对身边的“小家伙”说,科学只认第一,不认第二;谁先出成果,先发文章,谁就是老大。

  随着全球新型禽流感H7N9疫情爆发,4月7日华大基因研究院宣布,在人感染H7N9禽流感病例出现后,华大基因即积极联系参与研究病毒,并立即开启应急通道。目前已建立快速检测平台,可在36小时内对样本进行精确检测,希望能尽快得到样本。

  “就是说我们有这样的技术储备,只要拿到样本,那我们可以很快地去解析流感病毒的序列,很快分析出结果来。不过还没有收到消息。”4月10日下午,记者在华大基因7楼展厅旁的办公室见到华大基因品牌宣传部部长杨碧澄,其如是表示。

  华大基因有这样说话的底气。在2003年抗SARS研究中,华大基因在仅4天的时间内完成了有针对性的SARS病毒全基因组测序分析、蛋白质分析、检测试剂盒研制及抗SARS药物筛选等多方面的系统研究工作。

  2011年面对德国致病性大肠杆菌疫情,华大基因在收到样品后的3天内完成了大肠杆菌基因组的测序和初步组装,并及时将相关基因组序列数据公开分享。同时在最短的时间内研制出大肠杆菌的诊断试剂盒并向全球范围内无偿提供检测实验方案及所需引物序列信息。

  不久前的2013年3月24日,华大基因又有两项研究成果在同期《Nature》杂志上在线发表。

  这一次,它的科研成就来自于普通小麦A、D基因组供体乌拉尔图小麦及粗山羊草的基因组测序及分析工作。这仅仅是华大基因无数科研“首创”中的一项。

  2013年4月10日下午,在华大基因总部,深圳市盐田区北山道北山工业区11栋7楼展厅,记者目睹了这两篇学术著作。它与其他众多科研巨作被印刷出来,挂满在里侧的一面巨大的蓝色墙壁上。

  这就是外界盛传的满载科学光环的“基因墙”,在华大基因内部称为“论文墙”或“成果墙”。华大基因工作人员告诉记者,“这些供取阅的论文复印本我们补充得很快,但被取走的速度更快。”

  华大基因自1999年创立以来,迄今已有500篇学术论文发表在各类学术刊物上,其中登上《Nature》这一世界顶尖科研杂志上的有70余篇(在nature publish index(自然发表指数)的中国科研机构排名是,2010年第4,2011年第10,2012年第6)。

  并且,以往“1月1发”的华大速度早已被刷新到月均3篇——2010年,华大基因有发布在CNNS上的论文是14篇,2011年18篇,2012年36篇,2013年7篇(截至目前)。

  在中国,一个院士穷尽一生基本上也只能发2-3篇这样的重量级论文。而在华大基因身上,极限似乎远远还没有到来。

  华大基因CEO以及华大基因研究院院长,36岁的王俊,已在Nature系列和Science上发表了多达45篇学术论文;而华大科技CEO李英睿,年仅26岁,在同样的刊物上已发论文23篇之多;同样是26岁的郑汉城发表了10篇。

  这些如雨后春笋般冒出的科研成果,正如华大基因员工平均年龄不足27岁一样,让外界惊诧。2013年4月11日上午,记者在华大基因总部8楼会议室见到了华大基因小麦基因组科研人员张驰,年轻气息扑面而来。

  “科研没有第二,你只能先做出来。”张驰背靠沙发笑着说道,“论文之所以发那么顺利,很大原因是我们做的是小麦,全球最重要的粮食作物。之前国际小麦联盟想把小麦的21条染色体拿出来做,做了十几年才出来一条染色体,发了一篇nature;去年英国也做了一个,发了一篇文章。可以说我们做的是小麦基因类的第三个大文章。”

  该项研究成果表明,普通小麦追本溯源是30万年前先由祖先体乌拉尔图小麦(A基因组,控制产量和抗病性)与拟斯卑尔托山羊草杂交形成四倍体小麦(AB基因组);而后大约在8000年前,四倍体小麦再与粗山羊草(D基因组,控制品质和适应性)通过天然杂交,生成了六倍体小麦(ABD基因组)。

  由于普通小麦基因组大而复杂,其基因组数据在15-16G,为水稻基因组大小的40倍,目前只能先操作A、D单个基因组(B供体还未找到),各包含7条染色体。

  “用数据来说,水稻基因组数据的大小只有400M;而我们做的1个小麦D基因组就有4G,小麦基因组A有5G,难度很大。”张弛表示,“比如小麦D基因组,它包含7条染色体,整体是一个7条染色体的图谱,我们只能先打乱了这7条染色体,测出来10万个序列。这个成果还没细致到染色体,只是一个draft(草图),接下来我们要做精细图谱。”

  事实上,近日这项震惊基因界的小麦基因研究,就像在华大基因7楼展厅陈列的具有历史性意义的一项项展品,仅仅是华大基因庞大基因测序工作的冰山一角。

  故事最早发生在1999年。高中是理科生的人,一定记得生物书里说过,这一年中国科学家获准加入国际人类基因组计划,和美国、英国、德国、法国、日本共同研究人的基因组织,历时13年,斥资30亿。

  其中中国部分(1%)的绝大部分工作正是由华大基因完成,华大基因因此声名在外。

  “2000年克林顿访华,当时就点名要看华大基因。”2013年3月28日,在广州花园酒店一楼的咖啡厅,早在2009年就对华大基因发起调研的一家私募老总告诉记者。

  随后,华大基因2001年在杭州建立分部,做的第一件事情就是测了比人的基因还复杂两倍的水稻基因图谱。“当时日本也在测,我们发得比较早,他们不服气,说我们只是发了框架图。2002年,我们就把这个精细图发了出来。”4月10日在华大基因展厅,工作人员指着nature封面上盛得满满的一大碗白米饭说,“这个封面是我们自己设计的,这一大锅饭煮熟了,意思就是告诉日本我们把这个搞OK了。”

  2007年,汪建率华大南下深圳,并启动了另一个重磅项目——“炎黄一号”。工作人员表示,“我们将总部搬来深圳做的第一件事情,就是测出了第一个亚洲人的基因序列。当时做这个项目的时候,像李英睿他们基本一天就只睡4个小时。”

  2008年,华大基因开始研究熊猫的基因图谱。成果于2010年1月21日发表在nature上,封面有一句醒目的导读叫,“Next generation’s technologies crack Jingjing’s DNA sequence”。“这个测的就是国宝熊猫晶晶的基因。华大有一篇论文是讲熊猫在300万年前其实是吃肉的,更有意思。”工作人员透露。

  当然,华大基因的野心并不止于此,它要达成的目标是“大科学”,进而是“大产业”。2011年11月华大基因启动了3M基因组计划,即3个百万计划,包括百万动植物基因组计划、百万人基因组计划、百万微生态基因组计划。

  个人健康服务估值100亿

  有了研究成果,有了仪器,资本市场的机构人士开始关心,华大基因的盈利模式是什么。

  在华大基因官网上,产业部分下属有科技服务、健康服务、农业服务、信息服务4个子目录。

  “农业将来很可能产生一些比较成熟的,新的农业品种,它可以去推向市场;信息大部分还是处在研发的阶段,还没有完全可以市场化。”根据华大基因品牌宣传部部长杨碧澄的表述,农业服务和信息服务的商业模式还要经过一段时间的孵化。

  而随着测序能力和规模的提升,华大基因第一个也是最主要的商业模式由此诞生:为科研机构、医院、药厂、育种公司提供测序服务,即科研的市场化和产业化。

  这些在华大基因的组织机构下,主要是由华大科技来承载和运营。

  华大基因品牌宣传部部长杨碧澄告诉记者,“科技这一块,我们大部分是提供给专业人士,像院校的老师,院校的研究所,等等。一般像学校跟科研院所,华大不仅提供测序服务,最主要还有生物信息分析。我们给他们提供专业的技术支持和整套的解决方案。”

  据说华大基因已经跟全球的10000多个机构建立联系,像中科院、农科院、盖茨基金会等等。

  前文提到的小麦A基因组的测序由中科院遗传与发育生物学研究所发起,与深圳华大基因研究院和美国加州大学戴维斯分校合作完成。

  而小麦A基因组的测序则由中国农科院作物科学研究所牵头,与深圳华大基因研究院合作。

  为了满足全球基因测序的需求,华大科技早已做好了在全球范围内覆点的准备。它的组织架构的触角延伸到华中、华北、华南、华东、西北、欧洲、美洲、亚太和日本10大片区,这意味着,它的商业价值正在或者将从全球各个方向飞来。

  华大基因品牌宣传部部长杨碧澄告诉记者,华大基因在全球不同的地区设了400-500名科技代表。

  跟一般的公司不同,在华大基因不称“销售代表”,而是科技代表。“其实就是跟很多科技公司的市场模式是类似的,科技代表通过去做一些市场宣传,来建立我们的联系。肯定要在对应的领域,比如说科学界,去参加一些学术会议,让更多人知道我们可以提供这样的专业的技术支持。另外就是去拜访一下老师,去他们的机构直接进行面对面的交流、座谈。”

  在华大基因总部7楼的展厅内,有一块展板上陈列了华大基因近几年来的营业收入数据:2009年3.43亿元,2010年10.37亿元,2011年12.63亿元,2012年11.05亿元。这一连串的收入数字,绝大多数恰恰来自于科技服务。

  2012年12月,华大基因融得13.98亿人民币,出让的正是华大科技42%的股权。这已经是华大基因商业化程度最高,市场化最成熟的板块。

  而汪建似乎更看重产前检测、宫颈癌筛查等健康服务。在杨碧澄看来,健康是一个正在崛起的领域。截至2013年4月10日,无创产前基因检测已完成109582份病例检测,宫颈癌筛查完成331374份样品检测。

  而参与华大基因融资的机构人士则透露,“健康服务现在商业化程度不足,更多是规划中的东西。它2011年的收入只有2000万元,却报出100亿的估值,相比之下机构更愿意投科技服务。”

推荐
关闭