1.针对医学图像的Bag-of-Features表达中码本的量化和加权问题,突破传统的“0,1”量化的概念,创新性地提出了“多重软量化”的概念,并且对量化权重进行数学建模,得到了可以通过二次规划(QP)数学工具解的量化权重方法;另外,对于码本的加权问题,首次提出了利用每个码字构建弱分类器之后通过Ada-Boost算法来求取其权重的策略。

  2.针对蛋白质数据库检索中两个蛋白质对比的相似度计算问题,突破传统的“两个蛋白质相似度只与这两个蛋白质有关”的思路,创新性地提出了“两个蛋白质相似度也与数据库中其他蛋白质相关”的环境敏感相似度假设,并进一步探讨了“与哪些蛋白质相关”的问题,对数据集进行了图模型的表达,提出了利用两个蛋白质之间的最短路径对相似度进行扩散的计算方法。

  这两项工作主要由博士研究生王靖琰在李勇平研究员的指导下完成。该研究得到了973项目“基于上海光源针对重大疾病医学影像的若干关键问题研究”(2010CB834302)和“基于上海同步辐射光源的结构生物学技术和方法研究”(2011CB911100)的大力支持。