计算生物学所研究人员在理论群体遗传学取得重要成果

2010-8-24 16:38 来源: 中国科学院
收藏到BLOG

  如何可靠地检测新近发生的正选择?上海生命科学研究院计算生物学所李海鹏研究员的最新研究成果实现了20年来理论群体遗传学的一个梦想。

  正选择是一个重要的进化力量,它使得携带某个突变的个体相对于不携带这个突变的个体来说有生存和繁殖上的优势。正选择作为一种重要的进化力量,不仅在野生群体和现代人类的进化过程中扮演重要的角色,而且在家养动植物的驯化过程中(例如稻米、狗和猪)均起着决定性的作用。虽然我们无法回到过去,但是在最近1至10万年里发生的正选择事件通常都会在生物体的基因组里留下些蛛丝马迹。所以我们可以检测到这些正选择事件并且定位造成这些适应性进化的突变,进而为研究这些突变的功能开启大门。最终,我们希望通过这些研究来探索进化的根本奥秘——适应性进化的生物学机制。

  然而,在检测这些正选择事件的时候,人们发现所研究对象的群体数量在过去几万年里很可能在不断发生变化,这种群体数量的变化造成了相关检验方法(neutrality tests)的高假阳性率。例如,黑腹果蝇最早生活在非洲南部的一小块区域,在1至6万年前开始扩散到世界的其他地区。群体数量的扩张在果蝇的基因组里留下了几乎和正选择一样的痕迹,使得相关检验方法的假阳性率非常高(可以高达80%到90%),这就造成了针对近期正选择的检验可信度很低。

  为了降低假阳性率,目前几乎采用的唯一方法是在基因组水平上分析遗传多态数据。然而由于长期进化过程中所遗留下来的信息是有限的以及目前计算分析能力的局限,人们所采用的模型不可能无限地接近于实际,所以要精确估计出自然群体的历史数量变化的参数是相当困难的。所以这一方法仍然难以精确估计出具体的假阳性率,而且其可靠性仍就无法在数学上得到证明。不仅如此,由于一些重要的前提条件无法满足,使得该方法难以运用到绝大多数的野生物种和家养动植物的研究当中。

  基于此,在1989年Tajima提出了著名的Tajima’s D检测方法之后,针对其存在的问题,理论群体遗传学研究的一个主要目标就是要建立一个行之有效的方法,使得检测新近发生的正选择不受群体数量变化的影响。实现这个目标成为过去20多年理论群体遗传学追逐的梦想。

  李海鹏研究员的最新研究成果把这一梦想变成了实现。他提出了一种全新的通过检验树的拓扑结构策略来检测新近发生的正选择,并建立了相应的统计学方法。数学和计算机模拟两方面均证明了,该统计学假设检验的结果不受群体历史数量变动的影响,比如瓶颈效应和群体扩张。这意味着无论群体的数量在历史上如何变动,这一新方法的假阳性率将保持在统计学假设检验时所设的显著性水平以下。

  新的方法不需要任何种群历史的信息或者对种群参数的估计,也无需基因组水平的遗传多态数据,仅仅需要来自于100至1000bp范围内的遗传多态数据,就可以可靠地检测新近发生的正选择。这一新方法的建立将极大地促进相关领域的发展。

  该研究成果发表在MBE杂志上(影响因子9.872)(Haipeng Li, 2010, Molecular Biology and Evolution; doi: 10.1093/molbev/msq211)。