CLIP-seq (crosslinking-immunprecipitationandhigh-throughput sequencing)即紫外交联免疫沉淀结合高通量测序,可以高通量研究RNA结合蛋白在体内与众多RNA靶标的结合模式,并揭示其在一些重要生物学过程中的功能,是一项在全基因组水平揭示RNA分子与RNA结合蛋白相互作用的革命性技术。
CLIP-Seq原理
主要原理是基于RNA分子与RNA结合蛋白在紫外照射下发生耦联,以RNA结合蛋白的特异性抗体将RNA-蛋白质复合体沉淀之后,回收其中的RNA片段,经添加接头、RT-PCR等步骤,对这些分子进行高通量测序,再经生物信息学的分析和处理、总结,挖掘出其特定规律,从而深入揭示RNA结合蛋白与RNA分子的调控作用及其对生命的意义。依据处理环节的稍微差别,CLIP-Seq目前有不同变体形式,例如 PAR-CLIP和HIT-CLIP。
基础分析服务
1. 原始数据处理
过滤掉低质量的reads,去除barcode 和adapter序列,去除PCR duplication reads,得到clean reads。
2. 基因组和转录组比对
将clean reads 比对到基因组,将不能比到基因组的reads比到转录组,筛选出唯一比上的reads
3. 显著结合峰的识别与鉴定
将重叠的reads 聚类,鉴定识别结合峰,将一定范围内的结合峰聚成簇(cluster)
4. 结合峰特征分析
统计结合峰的在基因组的各区域的分布、长度分布、间距分布、结合位点的区域富集特征等。
5. 所结合的靶基因功能聚类
对有显著结合峰的基因进行功能聚类,分析此RNA结合蛋白所调控的生物学通路。
6. 最小结合基序分析
分析结合序列的共有基序(motif),分析结合序列的碱基类型分布
7. 靶基因直系同源基因分析
分析具有跨物种直系同源性质共同属于CLIP cluster靶基因的基因及其分布测序特征和趋势; 分析不同CLIP-Seq cluster 共同靶向位点临近性(空间距离临近的cluster)
8. 结合靶标的数据可视化展示
9. 反义转录结合位点(antisense binding sites)分析
个性化分析服务
深度解析CLIP-Seq数据,全基因组范围内鉴定RNA结合蛋白在不同RNA上的结合位点,展示RNA结合目标分布、结合基因、结合位点、结合基序和机制,进而发现新的机制和功能。可将CLIP-Seq与RNA-Seq等数据整合分析,研究RNA与蛋白结合后的转录后加工的调控机制。
1 CLIP-Seq 靶向区域特征高级分析
基因区域内splicing区域,intron区域等特征,分析靶基因可变剪切,内含子保留是否收到RNA结合蛋白的调控;同时,物种保守型特征(conservation) 加以分析。
2 CLIP-Seq 靶向区域特征高级分析
分析关注lncRNA基因区域的 CLIP-Seq cluster特征分布
3 内含子CLIP-seq结合位点特点分析
内含子位置效应和CLIP Seq cluster 关联性;motif 特征与intron的位置效应
4 RNA-Seq 表达谱关联分析(敲除实验功能验证后期的分析)
4.1. 差异表达RNA分析
4.2 分析差异表达基因与CLIP-Seq cluster之间相关性
4.3 Scatter Plot (RNA结合蛋白敲出后RNA水平差异数目分布)
4.4 差异可变剪切分析
4.5 RBPs蛋白相互作用于疾病调控网络
4.6 RBP结合蛋白与Motif独立进行系统发生树分析