XHMM分析原理是怎样的-四川平武建站

新闻中心

这里有您想知道的互联网营销解决方案

XHMM分析原理是怎样的

今天就跟大家聊聊有关XHMM分析原理是怎样的，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。

站在用户的角度思考问题，与客户深入沟通，找到永修网站设计与永修网站推广的解决方案，凭借多年的经验，让设计与互联网技术结合，创造个性化、用户体验好的作品，建站类型包括：成都做网站、网站建设、企业官网、英文网站、手机端网站、网站推广、域名注册、雅安服务器托管、企业邮箱。业务覆盖永修地区。

XHMM是一款利用WES数据分析CNV的软件，利用PCA降维来归一化外显子区的测序深度信息，然后通过隐马可夫模型来预测CNV,该软件的pipeline示意如下

XHMM分析原理是怎样的

可以分成4个大的步骤

1. 比对参考基因组

将测序的reads比对到参考基因组上，计算外显子区的原始测序深度。CNV预测的核心是通过测序深度和cnv的相关性来建模，所以需要保证这里的测序深度和真实DNA拷贝数的一致性，需要去除PCR重复。

官方推荐使用GATK最佳实践中的预处理流程, 同时还可以添加一个MAPQ的过滤，筛选MAPQ大于20的alignemnts，得到可以用于下游分析的bam文件。

2. 归一化测序深度

计算每个样本各个外显子的平均测序深度，得到一个exon平均测序深度的矩阵，示意如下

XHMM分析原理是怎样的

每一行为一个样本，每一列为一个eoxn区域，对应的值为该exon区域在样本内的平均测序深度。

在归一化之前，可以先对这个矩阵进行一个预处理，即对样本或者目标区域进行过滤。对于目标区域，去除GC含量小于0.1或者大于0.9的目标区域，去除包含10%以上的低复杂度序列的目标区域，也可以根据测序深度进行过滤，去除过低或者过高的目标区域，比如去除测序深度小于5X的目标区域；对于样本，可以根据测序深度的分布进行分析，去除离群的样本。

预处理的目的是尽量保证用于后续分析的样本在测序深度分布上的均一性，减小样本间的偏差。预处理之后就可以进行归一化，考虑到GC含量带来的PCR偏倚，芯片捕获，mapping准确率等系统误差的影响，采用PCA算法来去除系统噪声，得到归一化之后的测序深度。

效果如下图所示

XHMM分析原理是怎样的