【直播】我的基因组48:我可能测了一个假的全基因组

时间:2022-05-03
本文章向大家介绍【直播】我的基因组48:我可能测了一个假的全基因组,主要内容包括背景知识、我的测序结果、基本概念、基础应用、原理机制和需要注意的事项等,并结合实例形式分析了其使用技巧,希望通过本文能帮助到大家理解应用这部分内容。

背景知识

男性只有一条X染色体和一条Y染色体,所以,理论上它们上面的SNV都应该是纯合的! X,Y除了同源区域外,其它地方差异很大。所以在女性样本里面即使是混入了极低量的男性样本,也很容易检测出来。同理,男性样本里面混入了女性样本,会给男性带来大量的X染色体的杂合SNV,也很容易检测出来。

我的测序结果

我对前面步骤call到的vcf格式的变异位点文件进行了X,Y染色体的简单统计,代码如下:

cat  jmzeng.freebayes.vcf |grep -w 'chrY'|grep -v "^#" |cut -f 10|cut -d":" -f 1 |sort |uniq -c
cat  jmzeng.freebayes.vcf |grep -w 'chrX'|grep -v "^#" |cut -f 10|cut -d":" -f 1 |sort |uniq -c

结果不是很妙!

  • 按照道理,不管是X,Y染色体,我都只有一条呀!
  • 但是为什么我call出来的snp位点, 居然~~~这么多杂合的????
  • 尽管测序会有错误,不那么精准,但是误差不应该那么大吧!

我测试了另外一个软件call出来的snp位点,也用同样的脚本进行统计!

zcat jmzeng.bcftools.vcf.gz |grep -w 'chrX'|grep -v "^#" |cut -f 10|cut -d":" -f 1 |sort |uniq -c
zcat jmzeng.bcftools.vcf.gz |grep -w 'chrY'|grep -v "^#" |cut -f 10|cut -d":" -f 1 |sort |uniq -c

结果也不容乐观!

很明显,纯合杂合的问题,并没有测序深度的偏差,我暂时还不能确定问题出在哪里,接下来4篇帖子都会围绕着这个问题展开!

关于NGS数据探索性别相关问题,更多阅读,请自行前往我的博客搜索!