介绍国外几位生物信息学家(3)~~Gary Stormo

上一篇 / 下一篇  2011-05-23 23:27:01/ 个人分类:生物信息学家

  Gary Stormo, 1950年生于美国South Dakota州,现任Washington University in St. Louis的遗传学教授。Stormo进入Caltech开始学习物理学,但在低年级就转向了生物学。虽然他的物理学只是大学水平,对物理科学和数学的坚实背景帮助他为将来的机会打下了准备。他获得了位于Border的University of Colorado大学的分子生物学的博士,他主要研究兴趣集中在基因调控分析上,最早利用计算机来得到调控结构单元(motif)和理解基因调控。

  Stormo以研究生身份进入位于Border的University of Colorado大学,很快就对Larry Gold实验室中如何理解基因调控的问题产生了兴趣。在他的研究生的时候,DNA的测序方法已经被发展起来,这样他马上就获得了许多调控位点的大量例子,可以把它们相互比较,同时也可与他收集的突变位点进行比较。和Tom Scheinder一起,他着手编写了一个程序集,来对可能地数据进行各种各样的分析。那个时代,算法和数学都用得不是很难,甚至是非常简单的策略都是新的和有用的,他大胆地采用了一些人工智能的方法技巧来帮助理解,而最大的挑战是在他们不得不自己做所有的事情。GenBank那时还没有出现,所以他们不得不建立自己的数据库,用来存储他们的DNA序列和自己的注释;他们甚至不得不自行输入绝大部分的数据(这就花费了大量的错误检查时间),因为在那个时代大量数据只是简单发表在杂志上的。

  作为Stormo博士论文一部分,他发展了序列谱(profile,又叫位置加权矩阵,position weight matrix)作为比共有序列(Consensus)表征调控位点的一种更好的表示,发表了根据可用数据的不同类型和不同用途的一些相应的方法来得到序列谱。不仅如此,他还寻找了一类问题的解决方法:给定一些DNA序列的样本,在其中的未知位置上具有一些调控位点,发现这些位点的序列谱矩阵的问题现在称之为寻找序列谱问题(Motif Finding Problem)。几年以前,Michael Waterman已经发表了一个从一群DNA序列的样本中发现共有序列的算法,Stormo试图用序列谱的方式重复同样的事情。这个问题本来就有两个方面:怎样在没有检查所有的联配时,找到正确的调控位点之间的匹配?怎样评价在不同的匹配,选择最好的?对于评价这一步,他用了Tom Scheinder博士论文中基于熵的信息学方法进行度量,因为它具有很好的统计学特性,他们证明在一些简化了的假设条件下,熵的方法可以直接对应于蛋白质在这些位点的绑定能量。这个回顾似乎毫无意义,可在那个时代,想出这个方法却花费了他们相当大的努力,这个方法被用在贪婪法的CONSENSIS程序中。

  Stormo相信这主意会起作用,如他所想,事实正是如此:只要问题不是太难,从背景中凸显的模式就含有足量有效信息的内容。他知道这是一个非常有用的工具,虽然那时没有人能预料DNA阵列将使得它更为有用(这种实验可以更容易的推断出共调控的基因以选择好的样本)。当然,真实的这样的数据含有更大的噪声,因此算法必须改得具有更大的鲁棒性。

  在Stormo得到了他的博士学位之后,与他的指导者在Universit of Oregon的Larry Gold 和Pete von Hippel在合作项目中的工作,使他获得了最令人振奋的科研经验。Gold的小组以前研究T4噬菌体的基因,名叫32(它参与基因复制、重组和修复),已证明了它参与调控自己的转录水平的合成。Von Hippel的小组已经可以测量蛋白质绑定的参数,另一个小组刚刚测序了这个基因的序列和他的调控区域。通过整合序列分析和蛋白质的绑定参数,包括与其它序列进行比较,他们可以提供在基因调控中蛋白质活动的模型。一些年以后,Stormo开始帮助在两个较近的噬菌体T2和T6中,通过比较调控区域填补了更为详细模型的细节:研究显示有一个保守的假节(pseudoknot)结构在成核作用位点对自发绑定起作用。Stomo说:

  “这个结果非常令人满意,这是由于该问题的多个不同的方面,从生物物理的度量到遗传学,再到序列分析,集中到一起描述了一个真正有趣的基因调控的例子。”

  科学发现可以从多种途径得到,最重要的事要时时准备好。一些人将找到一类特殊的问题,并努力研究它,把所有的工具都用上,甚至发明新的工具来试图解决它。另一种途径是找到不同问题之间的联系,或者把一个领域中的方法应用到另一个领域的问题中。Gary认为虽然集中地努力研究一个特定的问题也很重要,而这种跨学科间的策略在生物信息中特别有用。他的研究总是根据他的兴趣很快从起始的问题焦点容易地转到别的地方。他觉得如果他是沿着一条更连续的工作路线,可能会在某个特定的领域作出更大的贡献,但是他非常喜欢广泛的阅读,为他可以作出贡献的问题进行工作,即使这些问题不是他主要的研究领域。

  “我认为虽然基因表达调控作为一个重要的问题有显著性的进展已经做出了,但对它的研究将持续很长的时间,这由于在调控因子和被调控的基因间还有许多没有探明的关系。加之大量的基因调控发生在转录后时期,在系统的道路上,我们仅仅开始了第一步。问题中主要的挑战是以能真正理解整个的调控网络为主要目标。我也认为进化生物学将成为一个发展的重要课题,可以来更深入理解地球上生物的多样性。”


TAG:

 

评分:0

我来说两句

显示全部

:loveliness::handshake:victory::funk::time::kiss::call::hug::lol:'(:Q:L;P:$:P:o:@:D:(:)

Open Toolbar