关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

表观基因组学研究指南(一)

2012.11.04

  今年九月,对于基因组研究者们来说是一个具有纪念意义的月份,因为美国人类基因组研究院(NHGRI)资助的ENCODE项目在Nature,Genome Biology,Genome Research等杂志上公布了三十多份论文,还有在Science,Cell,以及the Journal of Biological Chemist上的一些功能性介绍论文。这一项目的研究人员对147细胞系进行了将近1,650次实验,分子转录,转录因子结合,染色体拓扑结构,组蛋白修饰,DNA甲基化等多方面内容。

  包含这些种种功能元件的就是表观遗传学,近年来科学家们越来越意识到这些元件特征在发育和疾病中的重要性,因此早在2008年,也就是NHGRI启动ENCODE计划的五年后,NIH又开始了第二项大规模图谱绘制工程:表观基因组学路线图项目(Roadmap Epigenomics Program),这一项目整理了61个“完整”的表观基因组,并且未来还计划进行更多的研究,比如8号人类表观基因组图集(Human Epigenome Atlas)。

  目前已有一些研究人员参与到这些研究中,比如华盛顿大学的John Stamatoyannopoulos研究组就分析了DNaseI高敏感位点(DNaseI Hypersensitive Sites,DHSs)在多种人类细胞株全基因组的分布图谱及特征、DHSs与基因调控序列(主要是启动子与增强子)的关系、DHSs与转录因子基因组定位的关系及其在基因转录表达调控中的作用,以及揭示与疾病相关的非编码序列遗传变异的生物功能等。

  今年9月,这一研究组通过分析人类349种细胞和组织样本的全基因组DNase I图谱与已有的GWAS SNPs数据,发现约93%的与疾病和性状相关的SNPs位于非编码序列内,并且集中在DNase I高敏感位点区域(DHSs)。88%含有SNP的DHSs存在于胎儿发育阶段,并且在这些DHSs内的SNPs与妊娠暴露相关表型 (gestational exposure-related phenotypes)有关。此外,与含有SNP的DHS密切相关的远距离靶基因(绝大多数基因距离该DHSs超过100 kb)行使的功能与同一SNP相关的疾病表型相类似,这一联系拓展了在基因组水平疾病与性状之间的关联性,同时提供了一个潜在的致病基因库来解释这种关联性。93.2%DHSs内部的疾病相关SNPs同时位于转录因子识别序列内,并影响了局部的染色质结构。这些转录因子进一步形成复杂的网络系统,调控与疾病相关的基因表达。

  目前这些项目的研究数据都已公开,许多研究组都在其中分子他们的目标基因,组织和兴趣途径,然而对于许多研究人员而言,要处理,分析并观察这么多数据令人恐惧。来自NIH Roadmap Epigenomics Program的一位研究人员:John Satterlee提出了建议―― jump in and see what’s there,“这并不是像在浪费试剂,而是像在硅片实验室中进行实验”,他说。

  那么具体来说,我们如何进行表观遗传研究呢,有哪些工具能帮助我们呢?

  No.1 哪里找寻数据?

  ENCODE和NIH Roadmap Epigenomics 项目都能提供一些数据,从而研究人员能根据细胞或组织分类,或表观遗传标记来浏览这些数据,“至少能在三个方面进行选择”,来自贝勒医学院的一位遗传学家 Aleksandar Milosavljevic解释道,“研究人员可以选择相同的类型,检测和基因组内涵”。

  举个例子来说,假如感兴趣的是H1人类胚胎干细胞。在ENCODE项目主页上,从页面左侧的导航栏上选择“Experiment Matrix”,结果页面会显示出,针对H1人类胚胎干细胞有124个数据集,包括10 个RNA-seq和91 个ChIP-seq 分析数据集。单击任何一个小方块,就能看到这些数据。

  同时在人类表观基因图集和Roadmap Epigenomics Data浏览器中也能看到Roadmap Epigenomics数据,利用两个网页上的Search窗口,能筛选组织类型,并且研究人员还可以通过Roadmap Epigenomics Data浏览器顶端的Visual Data Browser 上的三个选项:Embryonic Stem Cells,Fetal Tissues,或Adult Cells & Tissues,筛选组织类型。这个项目收集了106个 H1胚胎干细胞的数据集,从而研究人员就能寻找其目标基因了。

推荐
热点排行
一周推荐
关闭