关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

单细胞数据细胞分类与功能挖掘的基因分析法介绍

2020.4.04

接触过单细胞转录组数据的小伙伴们都知道,数据的核心结果在于根据每个细胞的基因表达数据,来对细胞进行分群分类。现有通用的分析思路如下:首先根据转录组稀疏矩阵,通过计算和分析,找到不同的细胞Cluster,并找到每一类集群的Marker基因。根据已有对细胞特定Marker基因的认识,来对细胞可能的集群进行分类。因此,在该框架下,可以得到以下几个图:
 


图1. A.t-SNE细胞分群图及B细胞标记;B. B 细胞4个Marker基因标记分布图

上述结果有两个特点:1.通过在Marker基因中寻找存在的细胞marker对细胞进行标记,但无法给出可靠性评价;2.只能用一个基因的表达模式来反应细胞特征,无法同时对几个基因进行整合展示。因此,能不能将上述多个基因同时对细胞分群结果进行分类和量化,从基因集的角度来反应细胞的类群?

通过对最近发表分析算法的调研和调试,我们实现了这样一个需求。我们以上述标记基因: MS4A1,CD79A,CD79B和CD19,这4个B细胞特有Marker为基础,分别以其中一个基因表达为特征,和用4个基因的表达为特征,计算综合Score值,并将其结果在t-SNE结果中进行可视化展示,如下图:


图2. A.1个基因的B细胞标记分布图;B. 4个基因计算综合Score值后的细胞标记分布图

从上述结果可以看到,单纯用一个基因进行标记时,有些细胞不能进行很好区分标记,而当用4个基因同时进行计算标记时,得到的结果就非常完美。

有了基因集这样一个概念,我们就能够同时将多个基因为基础,对细胞进行更加精细和准确分类。同样,有了基因集的概念,我们对单细胞的功能挖掘也变得更加简单可行。

GSEA相信大家都很熟悉,通过基因集的角度,可以去评价样本间的功能差异,找到核心的功能和hallmarkers。但是,由于单细胞数据相比常规数据有数据稀疏细胞数量多的特点,用单细胞来进行传统的GSEA分析变的很难实现。幸运的是,有了上述的单细胞基因集分析方法,我们就可以用不同功能基因集,来实现对单细胞的细胞功能富集。我们以氧化磷酸化功能基因集数据为基础,对上述细胞集群进行分析和可视化展示,如下图:
 


图3. Oxidative Phosphorylation通路基因集结果

结果显示,在该数据中,左边颜色较深区域的细胞显著富集氧化磷酸化细胞功能。因此,只要有感兴趣功能的基因集,针对特定细胞集群的生物学功能挖掘,我们就能告诉您在哪些细胞中,该功能是显著富集的。

上述分析结果及图形化展示由SBC生物信息分析专家完成,如有基于基因集的细胞分类及功能挖掘需求,请联系上海生物芯片有限公司服务平台。


推荐
关闭