通过对一些已知的生物学通路进行测试的结果表明,该方法计算得到的基因权重和生物学认识是相符的;同一个基因在不同的生物学通路的权重可以不同,因此这些权重是生物学通路特异的;对基因网络的随机干扰试验表明,该方法得到的权重可以对抗相当程度的网络干扰,因而是稳定的。这些权重实际上可以和许多以前发展出来的算法相结合,产生带有基因加权的算法。在该工作中,以两种算法(MeanAbs和
GSEA)为例得到了相应的加权版本。通过一系列测试数据表明,对于包含重要性有差异的基因或者基因亚群的生物学通路,加权算法能够更好地检验这些生物学通路的显著性。

  在生物学通路分析中另外一个常常被忽视的问题是,一些通路也包含多亚基(multiple-subunit)蛋白质,按基因命名惯例,每一个亚基都有一个单独的编码基因,相应的结果是,这些信号通路中的多亚基蛋白相对于单个基因编码的蛋白来说,权重被高估了。在该工作中,通过将多亚基蛋白质作为信号通路的单一组成单位来纠正这种偏差。改良后的方法在三个独立的乳腺癌基因表达谱数据中的测试结果表明,加权算法找出来的生物学通路具有更好的可重复性。因此,这一工作表明:加权算法将有助于在生物学通路水平上更好地研究基因表达谱数据,为该课题组目前正在进行的肺癌基因组学研究奠定了坚实的基础。