介绍国外几位生物信息学家(6)~~Web Miller

上一篇 / 下一篇 2011-05-23 23:27:07/ 个人分类：生物信息学家

　　Web Miller, 1943年生于美国Wshington州，现任Pennsylvania State University大学生物系和计算科学与工程系教授。他从University of Washinbgton大学获数学博士学位，是DNA和蛋白质序列比较的先驱和领导人，特别是在全基因组序列比较领域。

　　Miller化了许多年研究用浮点代数理解计算机程序行为的计算技巧。1987年，他彻底改变了研究方向，选择生物信息学作为他的新领域。他说：

　　“我需要彻底改变的理由是非常简单的，它给我的生活带来新的更大的挑战和兴奋点。生物信息学之所以吸引我，是因为对于这个领域我几乎一无所知，也因为在那时没有任何人知道。”

　　这个改变的催化剂是他和Gene Myers的友情，而Myers已经在这个新领域开始工作。它那时还不叫“Bioinformatics”，Miller 转向这个领域还没有这个名字，他喜爱在一些对人类可能做贡献的领域前沿工作。

　　“这个改变对我来说是困难的，是因为我对生物学和统计学一无所知。这花费了很多年，我才真正理解生物学。我现在是一个生物系的职员，所以某种意义下，我成功地进行了转型。(不幸地是，我对统计学基本上还是很无知)在另一方面，这一转变也很容易，因为在这个领域所知还非常少。我读了Mike Waterman和David Sankoff的几篇文章，而后就此而止，开始了研究。”

　　Miller进入这个领域有两个已有的技巧被证明是非常有用的，这包括了他的数学技巧和编程经验，另有一系列的想法帮助他关注他的研究。他对这个领域贡献的第一个想法是优化了两个序列联配算法能够在正比于长些序列的空间内进行计算。在给定这么大空间内计算优化联配的打分不是很复杂，但是怎样对给定的打分构造一个联配就不是那么明显了。一个非常聪明的联配算法，被Don Hirschberg在1975年左右所发现。Miller贡献的另外一个想法是如果两个序列非常相似，当联配可以非常容易打分时，优化的联配可以不用动态规划而更快地计算出来，只需要一个贪婪算法。这个想法被独立由Gene Myers(在Miller的鼓励下)和Esko Ukkonen在八十年代发现出来。Miller希望这两个想法和他们的变种能够把他带入新的领域，他从"生物问题中寻找解答的方式”转向了“有解答后寻找生物问题”的研究形式。事实上，这是一种非常通用的在数理科学中培养出的科学家在生物信息中的研究范式。

　　在他早期的几十年的生物信息研究中，Miller是对线性空间的联配问题的一些论文的共同作者之一。找到一个称心的贪婪算法花费了很长的时间。可是，对于比较相似的DNA序列，这些序列是源于测序错误的不同而不是进化突变引起的，这个方法非常有效。因此，他们得到了生物信息学界的广泛认可。

　　Miller在生物信息项目中大部分的成功涉及到了除此之外的另一些想法，他把它们引入了这个领域。他更广为人知的项目是合作开发了BLAST程序，这个程序是David Lipman的眼光把该项目推向了正确的方向。但是，它是由Miller的对长DNA序列比较方法的工作使之更具有生物学的内涵，它使得Miller的算法用来给成队的科学家分析哺乳动物和其它全基因组序列的工具。Miller在1989年选择了作为他的“圣杯”的主题，并从此之后他就坚持这个方向。开始时，世界上只有两个足够勇敢或说是“愚蠢”的人来公开提倡测序小鼠的基因组序列与人类基因组进行比较--Miller和他长期合作的生物学家Ross Hardison。他们不时兜售在几个附近的物种中测序的想法。现在，所有的人都同意小鼠、大鼠、黑猩猩、狗和其它物种的测序工作是不可避免的，可是可能是Miller在比较基因组方面多年的编程工作使得这种不可避免的事件更早的发生了。

　　使Miller作出最好的工作，是他预料通过生物信息学的发展可以推动新的生物学的发现，那就是通过发展方法来比较整个哺乳动物基因组序列能够得到对进化和基因调控有更好地了解，这就可以使得他想做他想到的任何想法，并使之成为现实。这个工作包括发展算法来更容易地比对他能发现的最长的序列，还帮助Ross Hardson从实验上验证这些序列对基因调控是有价值的。当Miller和Hardison决定出示联配和生物实验的数据怎样联系到一个数据库的时候，他们学习了数据库的知识。当他们想开始设置一个网络服务器来比对DNA序列时候，他们学习了网络服务器的知识。当在他的实验室里没有人能够写他们组所需要的软件的时候，Miller自己编写了它们。当发明和分析一个序列的算法看起来很重要的时候，他开始了这方面的工作。这些方法已时过境迁，但是生物学的研究动机一直没有变化。

　　Miller更加成功地是追求“一个生物问题而不是其它的途径”。他的同事David Haussler，具有类似的经验，他的令人瞩目的成就就是把隐马模型和其它机器学习方法应用于生物信息学，而他里程碑式的成功是人类基因组的浏览系统，它使得更大的范围内的科学家得到了帮助，后一工作使前一工作黯然失色。

　　“我的职业生涯最令人兴奋的时刻是现在，每年都有一个脊椎动物的基因序列能够在我的研究中出现。某一天，我希望能骄傲地回首我在生物信息学中的贡献，可是可能它还没有被发现。”

导入论坛收藏分享给好友推荐到圈子管理举报

TAG:

查看全部评论