比对流感序列,进行多序列比对MSA

目的:比对流感的不同年份序列数据,挖掘蛋白质突变的具体区域
1、从GISAID网站上下载的序列,有ID重复,序列重复(仅挑选有HA蛋白,且数据完整(序列长度大于1700)的序列)文件格式为 x.fasta
2、使用seqkit rmdup -n x.fasta > xx.fasta //除去名字相同的序列
3、使用seqkit rmdup -s xx.fasta > xxx.fasta //除去序列相同的序列
4、在Multiple Sequence Alignment - CLUSTALW (genome.jp)网站上进行多序列对比,获得xxx.aln
5、使用Jalview软件打开xxx.aln文件,获得数据

版权声明:
作者:zhangchen
链接:https://www.techfm.club/p/168570.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>