关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

专家指南:如何研究基因调控(三)

2012.9.24

  Q5:在定位蛋白-DNA相互作用时,为降低DNA污染和片段化所引起的假阳性,同时也避免太严格的数据过滤所引起的假阴性,您的主要方法是什么?

  Marc Facciotti(加州大学戴维斯分校):

  首先,从微生物的角度来看,我们选择对天然表达的转录因子开展ChIP实验。我们认为,这能够将与过表达质粒相关的假阳性降至最低。第二,我们不会完全相信任何自动化的峰检测算法。我们的策略是建立我们自己的自动化峰检测工具,它让假阴性降至最低,代价是一些假阳性峰也会被报告。随后,我们手动组织峰列表,避免明显的假阳性。这听上去似乎很耗时,但对于小的微生物基因组并非如此。与后面追踪和验证假线索所浪费的时间和头痛相比,前面花费的时间是值得的。

  Kun Huang(俄亥俄州立大学):

  根据我的经验,关键是样品/文库制备步骤,我们与生物学家密切合作,以了解QC过程。根据我们对多个实验的观察,交联和超声处理步骤很关键,但没有得到足够的重视。与ChIP-PCR或ChIP-chip等方法不同,其中的污染或“坏”片段不会被扩增或测定,ChIP-seq将受到这些步骤的严重影响。因此在测序之前需要小心控制片段大小。

  对于文库中已经被测序的潜在污染,污染来源(如病毒)常常有着小的基因组,倾向于高度扩增。因此必须从原始数据中去除过度重复的序列。此外,有时候它们无法定位到参考基因组,因此明显降低定位率。在某些情况下,通过Blast高度重复的序列,我们可检测污染的来源。

  Jason Lieb(北卡罗来纳大学教堂山分校):

  免疫沉淀应当在封闭试剂(如BSA)存在时用经过验证的抗体来开展。最近Frank Pugh实验室开发出一种新技术ChIP-exo,无疑将提高信噪比。

  Xiaole Shirley Liu(Dana-Farber 癌症研究所):

  在研究蛋白-DNA相互作用时,ChIP-seq是最好的方法。DNA污染不是个大问题,但抗体质量会大大影响最终的数据质量和噪音水平。片段化(如超声条件)也有影响。抗体的质量控制、一致的步骤和生物学重复是确保数据质量的最好方法。分析方法也很重要。峰检出程序(如MACS)提供了每个的 ChIP-seq检出峰的倍数变化、p值和FDR。

  Jun Song(加州大学旧金山分校):

  我们使用对照DNA的测序数据,以便对细胞类型特异的背景噪音和偏向进行建模。我们还通过分离基因组区域,开展多个样品的标准化,这些区域包含来自背景区域的生物学信号。我们使用不同的回归模型和随机过程的思路,过滤掉偏向和假象。

  Q6:在ChIP-seq/ChIP-chip数据分析时,您首选的计算工具是什么?

  Marc Facciotti(加州大学戴维斯分校):

  我不能说哪个最喜欢。我们建立了内部的峰检测软件,它能够处理一些古怪的基因组。我们用custom R和Python scripts及其他现有的工具分析产生的峰列表。

  Kun Huang(俄亥俄州立大学):

  我们发现,在进行转录因子的常规分析时,商业化的软件(如Partek)非常有用。然而,我们一般使用两种或三种其他的峰检出软件包(MACS、 HOMER、SISSR),来检查峰检测的一致性。对于长的区域,我们使用内部开发的算法。我们应用多种方法来寻找motif,包括鉴定已知的 motif,并通过ChIP-Motif等工具进行de novo motif发现。Partek motif分析工具也十分有用。

  Jason Lieb(北卡罗来纳大学教堂山分校):

  对于ChIP-seq数据,我们一般使用ZINBA,对于ChIP-chip数据,我们用MA2C。

  Xiaole Shirley Liu(Dana-Farber 癌症研究所):

  我们最喜欢Cistrome和CisGenome。

  Kevin White(芝加哥大学):

  这是个快速发展的领域。我们今天所用的可能并不是明天所用的,因为峰检出的方法在不断改进。然而,我们现在正与斯坦福的Mike Snyder研究小组合作,重新分析来自modENCODE计划的人、果蝇、蠕虫和小鼠的ChIP-seq数据,以便为利用BWA和SAM工具进行比对和质量控制、MACS2进行峰检出和IDR进行重复性分析的研究人员提供标准化的数据集。

推荐
热点排行
一周推荐
关闭