DNA图谱中的峰信号,究竟受到哪些因素的影响?
谈论混合DNA图谱分型技术
DNA图谱中的峰信号,究竟受到哪些因素的影响?
PCR扩增效率(Amplification efficiency);
2. 模板量(Template);
3. 降解系数(Degradation);
4. 扩增子的分子量(molecular weight);
5. 等位基因类型(Heterozygote or Homozygote);
6. 位点特异性(Locus);
假设有如下图谱,贡献者为2,实际分型如下表
如果不考虑其他因素,分型的图谱应该如下:
1. 模板量:contributor 1>contributor 2
2. 降解因素:contributor 1> contributor 2
3. 扩增效率:Locus2 > Locus 1
4. Stutter
5. 模拟结果
STRmix生物模型考虑到了所有相关因素:
如何将生物模型应用在图谱的拆分中?
MCMC(马尔科夫链-蒙特卡罗算法)产生于19世纪50年代早期,是在贝叶斯理论框架下,通过计算机进行模拟的蒙特卡洛方法。
蒙特卡洛方法的实质是通过大量随机试验,利用概率论解决问题的一种数值方法。马尔科夫链是指生成随机数列的一种方法。
MCMC是一种简单有效的计算方法,在很多领域到广泛的应用,如统计生物学、贝叶斯(Bayes)问题、计算机问题等。
MCMC通过将随机生成的数值与之前的数值进行比较,通过检测是否与正确值更接近,来判断下一步是接受还是重新生成一个随机值,循环往复,最终找到最接近正确值的区域。云算GPM系统将这个过程分为两个部分,pre-burn
in 和post-burn in 分别计算10万次和5万次,最终找到正确的解释。
MCMC结合系统的生物模型,具体的工作方式如下:
目前云算GPM DNA混合图谱分析系统的客户数量已经近100个,主要分布在北美、欧洲,成为目前最受欢迎的混合图谱分析系统之一。