关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

基因组所开发出编码蛋白质DNA序列并行比对工具ParaAT

2012.3.05
  中国科学院北京基因组研究所基因组科学与信息重点实验室“百人计划”章张研究员,带领其团队成功开发出“编码蛋白质DNA序列并行比对工具—ParaAT(Parallel Alignment and back-Translation)”。该研究成果发表在Biochemical and Biophysical Research Communications杂志。

  同源序列比对是生物信息学最普遍使用的分析方法之一,其中,编码蛋白质DNA序列比对最为常见,对比较基因组学、分子进化学、系统发育等领域具有重要的基础意义。为获取相应的比对结果,通常采用的方法是将蛋白序列的比对结果“回译”(back-translate)成DNA比对序列,这样的比对结果比直接进行DNA序列比对更可靠、准确。为此,科学家提出了多个不同的工具,采用的策略都是先进行蛋白质序列比对,然后将比对结果回译成DNA比对。然而,这些工具每次只能处理一组同源数据,无法实现多组同源序列的对比工作。

  鉴于传统工具所产生的弊端,基因组所科研人员开发了ParaAT,成功解决了此项科研难题。ParaAT可实现多组同源编码蛋白质DNA序列的并行比对,不仅解决了大规模、多组同源序列的比对工作,同时也大大降低了运行时间,获得了较好的并行加速比(speedup),适合海量数据的分析工作。

  ParaAT可在不同操作系统下运行,支持多种不同的输出格式,方便后续相关的生物信息学分析(如用于检测自然选择压力的KaKs_Calculator)。

  

        文章链接

  软件链接

  83517_201203051324561.jpg

  83517_201203051324562.jpg

推荐
关闭