介绍国外几位生物信息学家(7)~~Gene Myers

上一篇 / 下一篇 2011-05-23 23:26:58/ 个人分类：生物信息学家

　　Gene Myers, 1953年生于美国Idaho州，现在是University of California at Berkeley的教授，美国科学院工程部的成员。他贡献了模式匹配和计算生物学的基本算法。他对BLAST的开发做出了关键性的贡献，这是最广泛的运用的生物序列搜索引擎，同时他还运用散弹法测序了人类基因组，并开发了拼接他们的方法。

　　Myers在远东地区度过了他的童年--巴基斯坦，印度，印尼和香港，和他的父亲东奔西走，他相信这个早期就暴露在不同文明和习惯下的经历使他对跨学科的工作产生了兴趣。他着迷于科幻类的作品，如他回忆研究了Gray Anatomy，还曾经并正在阅读Asimov, Heilein和Bradbury的作品。作为Caltech的大学生，Myers被灌输了一种“我能”的态度对待他所接触的科学。作为一个Unversity of Colorado的计算科学研究生，他着迷于算法设计。碰巧的是，他参加了由Andrgej Ehrenfeucht领导的电子讨论小组，在那里有未来的生物信息学家David Haussler和Gary Stormo。Myers被Andrgei Ehrenfeucht吸引是由于他广泛的兴趣：心理学，人工智能，正则语言理论和计算生物学，虽然那时还没有这个名字。

　　在1981年，Myers拿到了Universty of Arizona的一个位置，在那里他彻底忘记了对计算生物学的突击研究，而对传统的计算科学问题进行了多年的研究。在1984年，David Mount需要一个计算科学的助手来申请他构想的在Arizona州的计算生物中心，Myers那时正在比较文件(在GNU中的diff是他发展的算法)，这个工作在计算科学系是与DNA序列比较最相似的问题，因此他加入了这个课题。他回忆选择了DNA片段拼接的问题，还选择了序列中发现复杂模式作为研究申请的课题。杰出的评判小组包括David Sankoff, Temple Smith和Rich Robert，他们访问Arigona，邀请Meyers在Waterville Valley回忆上做了报告，这是有史以来最大的生物信息大会，他们对他的初步的工作留下了很深的印象。Meyers说：

　　“我喜欢和生物学家和数学家们合作，非常兴奋地能感觉到一些重要的工作可以做。因此1984年，我成为一个计算生物学家。这个，说真的，一个计算科学家感兴趣的问题是被计算生物学家提出的。再过下一个二十年，这已经改变了。”

　　在1980年，Meyers与Webb Miller进行了大量地合作，他也是生物信息学的先驱，他们发展了一些对序列比对基本的想法，比如线性空间的比对。他说：

　　"是Millers指导我，并真正的帮助我这样一个年轻的研究者的提高。我的写作和对自己工作质量的信心是一个非常艰难的过程，Webb是我数十年的领导，介绍给我写作的技巧。”

　　1989年，Myers寻找怎样找到小于二次方时间字串的近似匹配的算法，来和Zvi Galil的方法进行竞争。他那时吸烟，回忆与David Lipman在NIH外面谈话，一支雪茄使他有了想法。David，FASTA的共同发明人，觉得概念的启发式重组将可以能创造出一个更快和实用的蛋白质搜索工具。在此之后的几个月里，在Lipman的不停推动和鼓励下，Miller和Myers轮流编码不同版本的想法。在工作进行时，Steven Altschul贡献了他和Sam Karlin及Warren Gish一起做的统计方面的工作，真正最棒的代码，并完成了最后的产品。BLAST发表于1990年，放在了NCBI的网站上。它迅速成为生物信息学中最广泛应用的工具，科学上大量的引文在之后的几年内涌现出来。

　　Myers在1994年对小于二次方的算法做了最后的贡献，继而在近似寻找和片段拼接领域进行了工作。在1994年，相同的会议上，Waterman和Idary及Myers都展示了序列拼接的基本想法，一个是基于欧拉字串图的想法，另一个是基于断裂最大无竞争区间子图(collapsing maximal uncontested interval subgraph)的想法。除了显著的算法的进步之外，Phil Green完美的工作把PHRAP的拼接器成为他们正准备突击人类基因组的正在高速增长的测序中心的支柱。Myers认为他已经退出比赛了。在1995年Craig Venter和他的团队用散弹法测序了Haemophilus influezae, 一个1.8Mbp的细菌，而后用那时候还很年轻的Granger Suton写的程序拼接了它，这是对于大多数的生物信息学家一个非常触目惊心的成功，一个大的克隆，比如BAC在150bp左右，他们认为这是能用散弹法测序的极限。真正的整个基因组的程序的改进是围绕象BAC这样覆盖基因组的集合产物来实现的，而散弹法测序是用来对这样一个分层次进行的。许多具有这种印象的是基于Lander和Waterman关于DNA图谱的统计定理含义的错误认识。Myers说：

　　“我回忆开始对这个定理关于散弹法真正所说的进行再思考，在同一时间，遗传学家Tim Weber正在想通过散弹法作为途径来加速人类计划的进程，为了如他所愿的在研究中尽快得到人类遗传变异。Weber叫Lipman寻找一位生物信息学家合写一个申请书，Lipman就给他介绍了我，我说成，让我们想一想。在1996年，我们开始推动这个想法，试图发表一些模拟的结果以显示其理论上可行。对于这个申请书的反馈意见是非常负面的，我们基本上被判断为傻瓜。”

　　在几次被拒绝后，他们申请书的一个非常简略的版本和Myers的模拟结果最终发表于1997年，且是在有反对者Phil Green的条件下发表的。Myers估计他的申请书被毙了，但他仍然和他的学生在模拟的层次进行工作，因为他发现这个问题在智力上非常有趣。他说：

　　“我不停的做报告来说明它，希望有人能感到足够的兴奋来赞助这个千万美元的试点型项目。1998年，早期制造测序仪的Applied Biosystems公司和Graig Venter宣布他们将建立一个新公司来用散弹法测序人类基因组，对我来说这意味着有人决定化30亿来尝试我们的项目。”

　　Myers认识Venter已经十年了，很快就在Celera公司成立的初期1998年8月决定加入这个公司。得到了比他想象还要多的资源后，他研究的问题有了获得成功的希望。他说：

　　“那是我生命中一段不可思议的时间。我认为我可以做到，但我不知道怎样做。虽然压力是不可思议的，而兴奋感也是不可思议的。”

　　一年内，十个人的小组，几十万行的代码。这其中包含Granger Sutton, 他们成功地组装了Drosophila的的基因组，并于1999年10月发表了结果。Myers拥有了他们120Mbp的试点项目并获得了成功。而后，人类基因组的竞赛开始了。Celera的团队最大的障碍是怎样处理扩大30倍的人类基因组，计算机内存和时间都是真正的问题。用了20,000小时CPU时间和一个月的时间，最早一个人类基因组的拼接版于2000年5月完成。之后，经过了精炼后，首个人类基因组的重建由Celera和社会联合组织共同在2001年2月完成了。今天，整个基因组的散弹法测序都不再受争议了，它是每个被测序的基因组必须的途径。Myers说

　　“现在，在Berkley，我开始被细胞在粒子水平的工作所吸引，特别是细胞的发育。我找到的下一个挑战是‘解码细胞’。我被理智的好奇心所驱使，想在结束我学术生涯的时候，能对细胞这一系统有些许的理解。生物学是今天驱使我的动力。我的算法学家的技巧是用来完成这个目的的，而不是我最初的观点，虽然当我找到了一个难处理的新方法来解决一个特别的计算问题时，我仍然感到特别的兴奋!”

导入论坛收藏分享给好友推荐到圈子管理举报

TAG:

查看全部评论