目标区域测序是指利用特制的探针对客户感兴趣的蛋白编码区域DNA或某段特定序列进行捕获,富集后进行高通量测序的基因组分析方法。该方法能够获得指定目标区域的遗传信息,极大地提高了基因组中特定目标区域的研究效率,显著降低了研究成本。通过目标区域测序,可以对候选位点或候选基因进行验证,也可以进一步找到候选区域或候选基因内的易感位点,适用于候选基因关联分析等研究。
产品优势
- 检测区域明确:只需对基因组中感兴趣的候选区域进行测序就可满足研究需求;
- 成本低:被大幅缩小的测序区域,极大地降低了成本,非常适合大样本量研究;
- 精确:通过目标区域测序,可以对候选位点或候选基因进行验证,也可以进一步找到候选区域或候选基因内的易感位点,适用于候选基因关联分析等研究。
研究内容
一、标准信息分析
1. 去除接头污染和低质量数据
2. 数据通过BWA与UCSC hg19数据库进行比对
3. 数据产量统计分析、测序深度分析、覆盖度均一性分析
4. SNP变异信息检测(SAMtools、SOAPsnp、GATK)
5. SNP的RefGene注释
6. SNP数据库分析(与dbSNP、千人基因组数据、ESP外显子组数据库以及炎黄基因组(仅亚太地区)数据进行数据库注释分析)
7. 单样品SNP保守性预测、致病性分析(仅针对人类样本,软件:SIFT、Polyphen-2、Phylop、GERP scores、Mutation assessor、Condel、FATHMM)
8. SNP在各基因功能元件上的分布统计
9. Indel变异信息检测(SAMtools、GATK)
10. InDel的RefGene注释
11. Indel数据库分析(与dbSNP 、千人基因组数据、ESP外显子组数据库、炎黄基因组(仅亚太地区)进行数据库注释分析)
12. InDel在各基因功能元件上的分布统计
注:SIFT、Polyphen-2、Phylop、GERP scores、Mutation assessor、Condel、FATHMM这几个数据库的分析仅针对人类样本。
二、 高级信息分析(仅针对人类样本)
1. 通用高级分析
1) 非编码区SNP的注释分析(基于ENCODE数据库进行注释分析)
2) 非编码区InDel的注释分析(基于ENCODE数据库进行注释分析)
2. 肿瘤高级分析
1) 基于质谱的case/control样品成对初步鉴定(建议在测序前进行,需要额外增加约2周时间)
2) 成对样品的 Somatic SNV检测、注释及统计(与dbSNP、千人基因组数据、ESP外显子组数据库、炎黄基因组(仅亚太地区)进行数据库注释分析)
3) 成对样品的Somatic Indel检测、注释及统计(与dbSNP、千人基因组数据、ESP外显子组数据库、炎黄基因组(仅亚太地区)进行数据库注释分析)
4) 成对样品SNV/InDel的COSMIC数据库注释分析
5) 成对样品SNV的保守性预测(SIFT、Polyphen-2、PhyloP、GERP score、Mutation assessor、Condel、FATHMM)
6) 影响氨基酸改变的突变基因的CancerGeneCensus数据库注释分析
3. 复杂疾病高级分析
1) 样本设计以及power计算(项目设计阶段)
2) 群体SNP检测和基于连锁不平衡(LD)的Genotype分型检测
3) SNP 注释与统计(与OMIM和ENCODE数据库进行注释分析)
4) 群体SNP质控(base quality,map quality,allele balance,strand bias,mappability,homopolymer,Hardy-Weinberg Equilibrium测试,InDel附近的SNP过滤)
5) 基于遗传数据的样本质控:亲缘关系检测,基于近交系数的样本污染检测,PCA群体分层检测
6) 基于单个SNP的关联分析
7) eQTL分析(基于HapMap数据库进行注释分析)
4. 群体进化高级信息分析
1) 群体SNP检测,注释与统计
2) 群体SNP质控(base quality,map quality,allele balance,strand bias,mappability,homopolymer,Hardy-Weinberg Equilibrium测试、InDel附近的SNP过滤)
3) 基于参考单体型集合(HapMap/1000Genomes)的基因型推断和单体型定相
4) 基于遗传数据的样本质控:亲缘关系检测,基于近交系数的样本污染检测
5) 选择分析,可选择方法有:iHS,XP-EHH,DDAF,FST,Tajima's D,PBS等
6) GO功能注释分析,KEGG和PANTHER通路富集分析(可选;GO功能注释分析默认做,通路富集分析需要基因集基于通路筛选的可做)
5. 单基因病高级信息分析
1) 性别判断
2) 筛选影响功能元件的变异(优先考虑nonsynonymous SNP (nonsense, missense), frameshift indel, cds-indel;选择性的考虑非编码区部分注释为启动子、增强子、转录因子结合位点、DNA酶敏感位点的变异)
3) 筛选出的突变与已知数据库的注释和过滤(1000Genomes(1092),Hapmap、ESP(6500 Exome),PVFD)(需选择是否基于单基因病高级分析第2条)
4) case共有的突变筛选(需选择是否基于单基因病高级分析第 2,3条)
5) HMM 预测(患者的样本量需两个以上,不适用于患者亲缘关系为父子/父女/母子/母女的情况,三代及以上家系效果更佳)
6) SIFT 保守性预测(基于单基因病高级分析第 2、3、4条)
7) GO功能注释分析和KEGG通路富集分析(基于单基因病高级分析第 2、3、4条)
说明:4、5、6、7条原则上只提供给合作项目,服务项目若要提供相关分析,需与业务线联系定制化信息分析(仅针对人类样本)
6. 复杂疾病定制化分析(适用于大样本量,建议至少200对case & control以上)
1) Gene-based的关联分析(cmc,skat-o,wss,kbac,collapse)
2) 候选基因优化筛选
3) 候选SNP的条件分析
4) 候选位点附近的LD分析及基于单体型域的单体型关联分析
5) GO功能注释分析和KEGG通路富集分析(可选;GO功能注释分析默认做,通路富集分析需要基因集基于通路筛选的可做)
6) 基于代谢通路的交互分析(两交互或者多交互)(可选,默认不做;如果基因集是基于通路筛选的可做)
7) ROC曲线与遗传方差解释
8) eQTL 分析(基于HapMap数据库进行注释分析)
9) 群体CNV检测,注释与统计
10) CNV关联分析(Merge & Split)
7. 基于家系样本的de novo mutation分析
1) De novo SNV检测,注释与统计
2) De novo Indel检测,注释与统计
(以下条款适用于多个家系,建议至少30 trios或10-20 quads以上)
3) De novo SNV,Indel与疾病的关联分析
4) GO功能注释分析,KEGG通路富集分析,以及蛋白关联分析等
5) De novo SNV突变父母来源判断
更多详细信息请访问
或拨打咨询热线:
欢迎关注华大科技的微博和微信!
目标区域测序价格
目标区域测序信息由华大科技为您提供,如您想了解更多关于目标区域测序报价、型号、参数等信息,欢迎来电或留言咨询。