关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

HBFP数据库:人类体液蛋白质组研究又添一利器

2021.10.25

  人体体液是疾病相关蛋白的丰富来源,这些蛋白质从全身的病理组织中分泌或泄漏,许多可通过非侵入性方法获得。近些年来,研究者通过检查体液蛋白质组发现大量生物标志物,通过创新的高通量技术,现代蛋白质组学研究已经成功地在各种体液(如血浆、血清、唾液和尿液)中鉴定出大量蛋白质,成果显著。吉林大学教育部符号计算与知识工程重点实验室Shao Dan等开发出与之相对应的蛋白质组数据库,通过提供丰富的信息和功能分析,人体体液蛋白质组数据库(HBFP)是研究界探索各种体液中人类蛋白质组的绝佳工具。

banquan11.jpeg

图1 人体体液蛋白质组数据库(HBFP)在线网站

https://bmbl.bmi.osumc.edu/HBFP/

  在过去的几十年里,相关组织通过努力已经开发出几个基于社区的蛋白质组数据库,例如,2002年国际人类蛋白质组组织发起了人类血浆蛋白质组项目,并在其在线数据库中报告了人类血浆和血清蛋白质成分。尽管有包含了小规模和特定的数据资源,但考虑其作为系统的分析工具及可持续问题,目前的研究尚未将已发表的体液蛋白质文献整合成一个集中和的存储库。吉林大学等基于该领域的空白,开发了一个新的人体体液蛋白质组数据库,该数据库侧重于17种人体体液中经过实验验证的蛋白质组,见表1。

banquan11.jpeg

表1 总体统计数据

  目前,HBFP数据库存档了164份文献报道的11827种独特蛋白质,自2001年以来,肽和蛋白质水平的最大错误发现率为0.01,同时用户能够查询、分析和下载每种体液的蛋白质条目,见图2。

banquan11.jpeg

图2 HBFP查询页面的构建流程和使用

   此新系统的三个独特特征包括:(I)蛋白质注释页面包括基于原始参考文献中报道的肽的相对定性测量的详细丰度信息;(ii)对每个报道的蛋白质计算新的分数以指示发现置信度;(iii)根据人类蛋白质组项目数据解释指南,HBFP将7354个蛋白质编目为至少两个非嵌套的九个氨基酸的独特映射肽,而剩余的4473个蛋白质具有两个以上的独特肽,而没有给定的序列信息。

banquan11.jpeg

图3 五种体液(血、尿、CSF、SF 、BALF)蛋白质组的Venn图及共同含有的965 种蛋白质GO分析

  在过去的十年中基于图谱的蛋白质组学领域,许多计算研究有效发现新的蛋白质生物利用度和功能。课题组团队未来的计划是使用统计和机器学习方法纳入计算识别的蛋白质,这些通过计算预测的蛋白质可以作为生物标记发现的次级资源。作为人类蛋白质分泌组的重要资源,团队期望HBFP数据库能够成为促进临床蛋白质组学研究和生物标志物发现的有力工具。

【参考文献】

Shao D, Huang L, Wang Y, et al. HBFP: a new repository for human body fluid proteome[J]. Database (Oxford),2021,2021:baab065. doi: 10.1093/database/baab065. 


推荐
关闭