关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

专家指南:如何开展基因表达研究(三)

2012.12.20

  Q4:您在分析基因表达数据时通常借助哪些生物信息学工具?

  Gary Hardiman(加州大学圣地亚哥分校)

  • 利用内部脚本对读取进行QC

  • 定位到参考基因组(Bowtie 2)

  • 新的剪接检测(Cufflinks)

  • 转录本定量(FPKM)

  • 差异表达分析(edgeR, SAMR, cuffdiff)

  • 选定基因或转录本的覆盖图

  • 基因本体和通路分析

  • 互作组分析(gene networks)

  Chris Harrington(俄勒冈健康与科学大学)

  我们使用仪器供应商提供的软件来初步处理每个表达谱平台的数据。我们实验室一般不提供全面的数据分析,因此在交付数据后,许多客户使用开源的软件工具,或与生物信息学机构合作。这些机构对RNA-seq或芯片分析很有经验,他们通常使用开源软件或定制流水线。我们认为GeneSifter、 Partek Genomics Suite和MetaCore相对易用,且能满足很多客户的要求,特别是小的非临床研究。

  Ralph Schlapbach(瑞士联邦理工学院)

  对于芯片基因表达分析,我们依赖R/Bioconductor。这个框架为芯片分析的每一步提供了专用的软件包:预处理、标准化、差异表达计算和基因本体分析。Bioconductor软件包具有以下特征:支持所有厂商的所有芯片类型,执行最新的统计模型,支持重复研究,是开源的。具体来说我们使用 Affymetrix的软件包来预处理Affy数据。对于其他芯片类型,我们自己编写流水线来执行预处理步骤。

  对于NGS转录组数据的分析,我们依赖tophat来进行读取定位。我们评估数据质量,检查污染物,评估属于重复的读取比例,并评估片段大小分布、 3’-偏向和剪接点的覆盖度。对于差异表达,我们依赖Bioconductor软件包的edgeR。我们利用goseq软件包对基因列表进行功能注释。对于相关通路的深度挖掘,我们建议使用一个商业软件产品,如GeneGo的MetaCore,因为它们的通路数据库比公开的通路资源更全面,更准确。

  Q5:您如何确定绝对表达水平?

  Gary Hardiman(加州大学圣地亚哥分校)

  绝对定量应当利用数字PCR方法来进行,例如Bio-Rad的QX100。在缺乏数字仪器时,可以采用比较传统的方法,根据标准曲线和已知浓度的样品来确定未知浓度的样品。

  Ralph Schlapbach(瑞士联邦理工学院)

  就每个细胞中转录本拷贝的数量而言,无论是芯片,还是新一代测序,都不能提供绝对的表达水平。我们采用RSEM来计算样品中每个isoform的相对丰度。这种方法假定每个细胞中RNA的总量是恒定的,或RNA拷贝总量的变化不相关。如果这些假设不成立,那么我们建议与额外的加标(spike- in)一起测序,以控制起始材料的量。

  Q6:您如何确认您的发现?

  Gary Hardiman(加州大学圣地亚哥分校)

  来自RNA-seq和芯片的表达数据可通过qPCR来确认。

  Craig Praul(宾夕法尼亚州立大学)

  我认为,如果研究人员仔细比较各个结果,那么他们会发现qPCR、芯片和新一代测序都得到了类似的结果。MAQC研究指出,你应当确保,在比较芯片和qPCR实验时,你在研究相同探针的表达水平。在将新一代测序结果与qPCR或芯片比较时也一样,你比较的读取应与探针覆盖的区域相同。你必须清楚,平台之间基因表达水平的差异可能仅仅在于它们测定了不同的外显子。在测定基因表达时,若未考虑剪接变体的差异表达,则会导致各平台之间某种程度的不一致。

  我建议任何人使用新一代测序或芯片来发现他们认为表达有差异的基因,并利用实时定量PCR来确认这些发现。实时定量PCR让我们能够以更加合理的成本检查更大量的样品。分析更大量的重复,将为研究人员带来更多的统计可信度。

推荐
热点排行
一周推荐
关闭