关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

重感冒病人患上帕金森氏症的风险是健康人的两倍

2012.7.22

  在去年召开的美国微生物学会上,来自明斯特大学的医学微生物学家Dag Harmsen开始听到了有关德国大肠杆菌疫情爆发的传言,这场疫情首先在德国北部地区爆发,感染了至少4000人,夺去了超过50人的生命(德国范围内),在德国以外的欧洲地区也发现了76名患者。

  Harmsen 教授在这场疫情中发挥了重要的作用——他们通过将引发此次疫情的O104:H4型肠出血性大肠杆菌与2001年采集自一名溶血性尿毒症(HUS)体内的 O104:H4型肠出血性大肠杆菌进行基因对比后,发现,两种菌株并非同源,引起此次德国EHEC暴发的O104:H4菌株来自一种肠聚集性大肠杆菌 EAEC O104:H4 55989菌株的变异,其中还掺杂了一种目前未知的由志贺毒素产生的O104:H4菌株。

  在这一场“战役”中,Harmsen教授主要采用的就是新一代测序技术,他说,“至今,新一代测序技术已经遍布全球上百个基因组测序中心”。并且随着更多更新技术的发展,未来新一代测序技术将发展出下下一代创新技术,为基础科学与临床治疗提供越来越完善的帮助。近期The Scientist杂志就以“Sons of Next Gen”为题,介绍了目前值得关注的各种新技术。

  压缩数据

  各种新型测序技术为我们实验带来了高通量测序的方法,为生物医学研究提供了更加广阔的研究思路,但是这些新技术也导致了一个日益严重的问题——如何处理这些数据。即使是对于更传统的新一代测序技术,也需要将数据外包给某些基因组研究中心,然后兆兆级别(terabytes)的测序数据又被返回到原实验室。

  “对于许多生物学家而言,这是第一次他们需要处理如此大数据量的数据”,来自英国欧洲生物信息学研究所的生物信息学家Ewan Birney说,Birney加入了美国政府主持的国家生物技术信息中心,后者旨在获取来自全球的测序数据。

  一些研究团队发展了一些新方法制止数据膨胀,比如Birney和他的同事就研发了一种能比标准压缩方法小5-50倍,来压缩数据信息的运算方法。这一系统基于图像和视频压缩方法(就像是YouTube,或者卫星电视),并利用了测序数据高度冗余的特点。

  这种算法能将每次阅读与参考数据进行比对,然后标记出两者的差别,忽视那些相同的地方,比如说,在一个新完成的人类基因组序列中,与参考人类基因组相比,只有10,000个碱基对分之一存在差异,这样大部分的数据可以忽略不计。

  制药公司和生物技术公司也在加紧开发基因测序数据共享框架,许多公司还参与了一个非盈利组织:Pistoia Alliance,这一组织创始人Nick Lynch 说,Pistoia Alliance就是希望能完成基因测序数据共享框架。

  去年11月,这一组织宣布了Sequence Squeeze挑战,团队成员以竞争的方式,力求最短时间内将一个参考序列压缩至最小尺寸。这吸引了许多处理大量研究数据的研究人员,比如计算机科学家,还有天体物理学家,利用他们的知识来解决测序难题。

  得胜者是来自Sanger研究院的James Bonfield,他能将原始序列压缩至一个非常小的大小,而且压缩和解压的过程时间都很短。“我们希望(这一技术)能在全球应用,成为数据处理的一种方法”,Lynch说。

推荐
热点排行
一周推荐
关闭