GWAS | 基因型数据描述性统计

完成标记开发后,会得到基因型数据,首先要对基因型数据进行统计,用到的工具是plink,安装及基础用法见链接:
plink安装及基础用法 - 简书 (jianshu.com)

统计主要包括标记水平和个体水平两部分:

  • 标记水平:缺失率、杂合率、等位基因频率;
  • 个体水平:缺失率、杂合率。

输入

$ ./plink --allow-extra-chr --freq --hardy --missing --het --vcf genotype.vcf

--allow-extra-chr:允许额外染色体编号
--freq:最小等位基因频率
--hardy:标记杂合度
--missing :标记与个体水平缺失率
--het :个体纯合基因型数目
--vcf :指定 VCF 文件为.vcf,也可以是压缩格式.vcf.gz

输出

plink.frq:标记最小等位基因频率 MAF

image

plink.hwe:标记杂合度 O(HET)

image

plink.lmiss: 标记缺失率 F_MISS

image

plink.imiss:个体缺失率 F_MISS

image

plink.het:个体纯合度 O(HOM) / N(NM)

image

转自:https://www.jianshu.com/p/5b4a9566eee7

版权声明:
作者:感冒的梵高
链接:https://www.techfm.club/p/45666.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>