关注公众号

关注公众号

手机扫码查看

手机查看

蛋白质组学专题 | 蛋白质组文章怎么写?学会6条分析内容就搞定

迈维代谢
2023.2.08

3748559d60b676d6ffb3a79bb993747d.gif


上期推文分享了疾病机制研究文章中必要因素(蛋白质组学专题 | 必看干货:疾病机制研究文章中必要因素有哪些?),即文章主体结构组成有哪些。本期则主要分析文章中基础/高频分析内容有那些,如何高效应用这些分析。同样的小迈特别总结了蛋白组经典期刊Proteomics和Journal of Proteome Research 2022年发表的近20篇蛋白组学文献,总结文章分析内容及图表展现形式,深入剖析分析内容意义,部分文章列表如下。


0a8e929e6b359f737dd9bcc4e3106bbc.png

PART
01分析条目

对20篇文章总结,分析内容共13条,涉及18张图,包括差异蛋白筛选、PCA分析、共有蛋白筛选、火山图、聚类分析、GO富集分析、KEGG富集分析、部分蛋白差异展示、ROC分析、临床特征相关性分析、蛋白相关性分析、互作网络图、生存分析。出现频率超过60%的分析为差异分析、GO富集分析、聚类分析、KEGG富集分析、部分蛋白差异展示,以上分析基本为文章必备。部分析内容虽频率较低,但对于确定候选蛋白明确疾病机制具有重要意义,如临床特征相关性分析、蛋白互作分析、生存分析等。接下来详细剖析各分析内容要点。


84d19766fc5af6f790ab112347c5a947.png


PART
02分析内容剖析

1. 差异蛋白质筛选

除部分标志物研究文章外,文章中涉及机制研究内容都需要进行差异蛋白质筛选。差异蛋白质筛选常规方法有差异倍数法、t-test、ANOVA、多重假设检验。一般两组比较选择t-test分析,多组比较选择ANOVA分析。差异倍数筛选指标为FC,t-test、ANOVA筛选指标为p-value,多重假设检验筛选指标为校正后的p值。随着假设检验次数增加,p-value错误率升高,多重检验p-adj一定程度降低p-value错误率。当两组样本比较时选取p-value/p-adj+ FC 组合筛选差异蛋白质。当多组样本比较时采用ANOVA分析,以p-value为指标。对17篇文章进行统计,其中以p-value+FC筛选差异蛋白质最多,高频筛选标准为p-value<0.05+FC>1.5或FC<0.66,筛选参数可进行调整并组合,如FC>2或FC<0.5、FC>1.2或FC<0.83、p-value<0.05。以p-value<0.05+FC>1.5或FC<0.66为筛选标准时,差异蛋白过少,可调整FC<0.83、FC>1.2,或仅参考p-value;差异蛋白过多时,可调整|log2FC|>1或p-value<0.01,进一步缩小范围。

1f85376ad04db5e0affc7bb10dc72b3e.png


 2. 火山图

差异蛋白质筛选过后,会在文章中以文字形式进行说明,若需展示则会选择火山图进行展示。火山图一般是对差异蛋白质筛选结果的展示,可通过火山图直观了解差异蛋白质有那些以及数量。一般火山图横纵坐标为log2FC、-Log10p-value,并画出临界线,以表明差异蛋白质所在区域。如在图A中,通过火山图与文字对应,表明在WT组和KO组比较后,共筛选出267个下调蛋白、302个上调蛋白。在图B中不仅展示了差异蛋白质筛选条件,并对差异蛋白质进行注释,表明具体蛋白质,方便观看。


7e5e0fc23608ccd5901874f71d529894.png

    

火山图展示(Shuhui Menget al,2022;Bing Wang et al,2022


 3. GO富集分析

Gene Ontology(简称GO,http://geneontology.org/)是基因功能国际标准分类体系,世界上最大的基因功能信息来源。作为基因本体联合会(Gene Onotology Consortium)所建立的数据库,它旨在建立一个适用于各种物种的,对基因和蛋白质功能进行限定和描述的,并能随着研究不断深入而更新的语言词汇标准。GO分为分子功能(Molecular Function)、生物过程(biological process)、和细胞组成(cellular component)三个部分。


GO富集分析是指与所有鉴定到的蛋白质背景相比,差异蛋白质中显著富集到的GO功能条目,从而给出差异蛋白质与哪些生物学功能显著相关,以辅助数据挖掘,明确致病机制及关键蛋白,并在文章讨论中说明。GO富集分析展现形式,如条形图、气泡图,图形中大部分是对富集条目、富集因子、显著性、差异蛋白数量的展示,一张图可展示除富集条目外一个(条形图)或多个因素(条形图、气泡图)。某些文章只关注部分富集条目,可根据显著性进行过滤,文章中基本采用p-value<0.05。如下图A所示,在血浆蛋白组研究中,筛选差异代谢物后GO富集分析以条形图进行展示,图中展示了富集条目、差异蛋白数量以及p值。富集气泡图一般包含4个元素:富集条目、富集因子、蛋白数量、显著性,可多方面协助筛选重点GO富集条目,富集气泡图详细看法可点击浏览视频实操SCI作图课(15):高级富集气泡图


ab95d9cf9beb134625c60ae9b40c4304.jpeg

    

GO富集分析展示(Na Wu et al,2022;Xiufang Wang et al,2022)


 4. 聚类分析

在文章中,经常会看到红绿相间色彩丰富的小格子组合成的一张图片,并且会对行数据和列数据进行聚类,这个图称为聚类热图(也叫Heatmap),是对聚类分析的可视化。热图的基本原则是将数据矩阵的数值,按照一定的规律转换为颜色,通过颜色的不同变化来展示数据的差异。


聚类分析作用主要有两个:1)反应生物学重复是否合理,若组内生物学重复可很好聚集在一起,则表明实验处理得当,生物学重复合理。2)热图的另一个作用是直观展示重点研究对象的表达量数据差异变化情况。可通过聚类热图了解蛋白变化趋势,通过蛋白聚类情况进一步筛选蛋白簇,从而与生物学意义相结合。在前列腺癌严重中,聚类分析显示56个蛋白在高危原发性PC(早期前列腺癌)中高表达,而在低危原发性PC和BPH(良性前列腺增生)中低表达,且进一步筛选候选蛋白后再次进行聚类分析。


d2fc1a5cd1c1bd14237fcc9ac97a2371.png

    

前列腺癌研究中的聚类分析(Qihuan Fu et al,2022)


 5. KEGG富集分析

KEGG数据库目前发展为一个综合性数据库,其中最核心的为KEGG PATHWAY 和KEGG ORTHOLOGY数据库。KEGG富集分析首先通过KEGG注释分析将差异蛋白质进行了分类,接着对蛋白(基因)功能进行富集分析,以发现在生物学过程中起关键作用的生物通路,从而揭示和理解生物学过程的基本分子机制。另外在不同实验条件下,激活的通路显然比简单的基因和蛋白列表更有说服力。


KEGG富集分析展现形式,如条形图、气泡图、通路注释图,图形中大部分是对富集条目、富集因子、显著性、差异蛋白数量的展示,一张图可展示除富集条目外一个(条形图)或多个因素(条形图、气泡图)。某些文章只关注部分富集条目,可根据显著性进行过滤,文章中基本采用p-value<0.05。在宫颈癌研究文章中作者重点关注了AMPK信号通路,并对通路上的差异蛋白进行了展示,进一步缩小候选蛋白,并进行验证。


88a42990cf6a2929dde15c574268518d.png

    

宫颈癌研究中的KEGG富集分析(Bing Wang et al,2022)


 6. 部分蛋白差异展示

大部分文章会对候选蛋白进行重点描述,如对部分蛋白进行聚类分析、重点展示候选蛋白差异变化,主要以热图形式展示。另外高达72%的文章对关键蛋白进行了验证,并以胶图或柱状图形式展示(验证方法可参考:蛋白质组学专题 | 必看干货:疾病机制研究文章中必要因素有哪些?)。下图A肠道疾病研究中对糖酵解途径重点蛋白ENO1进行了验证,下图B中药物Fingolimod研究中,将重点候选蛋白质以热图形式展示,通过热图颜色展示候选蛋白质差异倍数。

a3c7e132cc26d4c15248fde253b9ec29.png

    

部分蛋白展示(Mehdi Mirzaei et al,2022;Huichun Shi et al,2022)


除上述分析在文章中出现比例高外,还有部分分析内容有助于数据挖掘,如PPI分析、WPCNA分析、临床特征相关性分析等。可通过PPI分析了解蛋白间关联度,并筛选核心蛋白,临床特征相关性分析、WPCNA分析可了解差异蛋白与临床表型之间的关系。

7530491f7b7842591fb9fb536dc45c37.png

    

PPI分析、临床特征与蛋白相关性分析(Andy V. Khamoui et al,2022)

PART
03迈维时刻

看了上文内容,相信您对蛋白组学研究必要因素有了一定的了解,如需了解具体分析内容、数据挖掘、验证方法优劣势可继续关注小迈。另外迈维代谢提供领先的蛋白质组学服务,如有需求快来联系小迈吧。

a5d03a682b7b2ffc674dca6edfa8c8ea.png

039e74882c7f82143b53afcc89ee52d4.gif

99%的代谢组学研究者都在阅读下文(精彩合集,欢迎收藏):

迈维速递|1月,最值得看的8篇代谢组学高分文献!

网络药理学专题 |  IF14!中药代谢组+网络药理学研究牛樟芝治疗肝癌

蛋白质组学专题 | 必看干货:疾病机制研究文章中必要因素有哪些?

项目文章丨IF=17!肠道菌群及代谢与血管功能再添力证

项目文章集锦

蛋白专题合集

Biomarker专题合集

空间代谢组合集

肠道菌群&微生物专题

生信小工具专题


dd1da880f326199174e2a9dfc7faa6fe.jpeg


996a75f323f9b291e084199f8a4c24aa.gif

客服微信:metware888

咨询电话:027-62433042

邮箱:support@metware.cn

网址:www.metware.cn

我就知道你“在看”

248cd138ef1f8b06443d5d745bbb25e9.gif

推荐
关闭