关注公众号

关注公众号

手机扫码查看

手机查看

喜欢作者

打赏方式

微信支付微信支付
支付宝支付支付宝支付
×

DNA图谱中的峰信号,究竟受到哪些因素的影响?

2020.4.21

谈论混合DNA图谱分型技术

 

DNA图谱中的峰信号,究竟受到哪些因素的影响?

  1. PCR扩增效率(Amplification efficiency);

2. 模板量(Template);

3. 降解系数(Degradation);

4. 扩增子的分子量(molecular weight);

5. 等位基因类型(Heterozygote or Homozygote);

6. 位点特异性(Locus);

假设有如下图谱,贡献者为2,实际分型如下表

 


如果不考虑其他因素,分型的图谱应该如下:

 

 

1. 模板量:contributor 1>contributor 2

 

 

2. 降解因素:contributor 1> contributor 2

 

 

3. 扩增效率:Locus2 > Locus 1

 

 

4. Stutter

 

5. 模拟结果

 

 

STRmix生物模型考虑到了所有相关因素:

 


如何将生物模型应用在图谱的拆分中?

MCMC(马尔科夫链-蒙特卡罗算法)产生于19世纪50年代早期,是在贝叶斯理论框架下,通过计算机进行模拟的蒙特卡洛方法。

蒙特卡洛方法的实质是通过大量随机试验,利用概率论解决问题的一种数值方法。马尔科夫链是指生成随机数列的一种方法。

MCMC是一种简单有效的计算方法,在很多领域到广泛的应用,如统计生物学、贝叶斯(Bayes)问题、计算机问题等。


MCMC通过将随机生成的数值与之前的数值进行比较,通过检测是否与正确值更接近,来判断下一步是接受还是重新生成一个随机值,循环往复,最终找到最接近正确值的区域。云算GPM系统将这个过程分为两个部分,pre-burn in 和post-burn in 分别计算10万次和5万次,最终找到正确的解释。

MCMC结合系统的生物模型,具体的工作方式如下:

    

目前云算GPM DNA混合图谱分析系统的客户数量已经近100个,主要分布在北美、欧洲,成为目前最受欢迎的混合图谱分析系统之一。


推荐
关闭