App TRAN003 顺式调控网络的时空模型
基因表达状态一般是受到转录调控元件模块的调控,我们称其为CRM(cis-regulatory modules)。CRM整合多转录因子的调控效应,产生生物系统特异的时空基因表达状态。因此,基因的时空表达效应和调控元件的识别一直是生物学最重要的也是最具挑战性的科研课题。本方案将涉及和分析关于CRM可能在发育生物学研究领域以及其他领域内的调控规律;本方案基于二代测序技术或者基于免疫共沉淀-芯片联合技术帮助识别CRM。同时,针对不同转录因子的结合位点峰谱构建具有时空特异性的调控模式模型(Model)。该方案将发现研究所关注的在生物系统的时空效应上发挥重要功能的转录因子的组合调控规律和靶基因的表达模式。
分析内容与主要步骤:
(1)实验设计
针对研究感兴趣的转录因子设计chip-on-chip或者Chip-seq湿实验,同时设计考察转录因子在不同组织(空间)和发育时期,时间序列(时间)的结合谱。(如图例-1,不同转录因子在同一时期的peak峰结合谱)
(2)顺式调控元件模块-CRM通过聚类方法识别顺式调控元件模块-CRM ,构建Chip-CRM图谱; 统计CRM所占基因组区域,长度,分布特征;分析在同一条件时间序列点上的,不同转录因子结合位点相对于TSS的距离。
图例-1 构建信号图谱-Signa maps和识别CRM
(3)转录因子结合位点分析通过以往实验关于TF转录因子结合位点的报道计算获得PWMs矩阵,并在基因组中识别对应位置,该结果用于和Chip实验获得的CRM做比较验证;
(4)TFBS保守性分析通过TFBS的保守性分析Chip-seq的准确性,探索分析各个转录因子的CRM TFBS是否存在显著保守性和功能性。
(5)构建时空特异性调控模型
选择用于构建调控模型的阳性训练数据集,包括来自文献挖掘和数据库获得的转录因子CRM表达数据;Chip-peak高度作为转录因子结合性的定量指标,通过SVM(支持向量机)模型构建Chip-CRM调控模型;根据转录因子结合谱 Chip-peak和构建的模型预测基因,预测CRM时空特异性表达(图例-3);
图例-3 构建时空特异性调控模型
(6)CRM时空特异性表达模式
在某特定组织(空间)条件下,转录因子具有的不同CRM在时间序列上的结合模式;该分析将给出转录因子的时空特异性活性;另外,结合训练数据集并根据SVM构建CRM表达谱模型,可预测上述转录因子的CRM;