samtools Bam文件常用操作
sam文件转bam文件
- -f 有某个flag值的序列
- -F 不含有某个flag值得序列
- -b 输出BAM格式
samtools view -S test.sam -b > test.bam
#比对到负链的reads
samtools view -f 16 test.bam
# 比对到参考基因组的序列,flag值为4代表比对不上
samtools view -F 4 test.bam
bam排序和建索引
- -@, --threads 可以添加线程数
samtools sort test.bam -o test_sort.bam
samtools index test_sort.bam
bam文件reads计数
samtools view -c test.bam
depth
计算每一个位点的测序深度
samtools depth test_sort.bam > test_depth.txt
tview
tview能直观的显示出reads比对基因组的情况。
- -p 染色体位置
samtools tview -p chr17 test_sort.bam genome.fa
bam文件合并
使用samtools merge命令将BAM文件合并为单个文件,假设您要将3个BAM文件(file1.bam,file2.bam和file3.bam)合并为名为merged.bam的单个文件。
samtools merge merged.bam file1.bam file2.bam file3.bam
fastq文件建索引
结果会生成后缀为.fai的索引文件
samtools faidx test.fasta
BAM文件flag记录
1:该read是成对的paired reads中的一个
2:paired reads中每个都正确比对到参考序列上
4:该read没比对到参考序列上
8:与该read成对的matepair read没有比对到参考序列上
16:该read其反向互补序列能够比对到参考序列
32:与该read成对的matepair read其反向互补序列能够比对到参考序列
64:在paired reads中,该read是与参考序列比对的第一条
128:在paired reads中,该read是与参考序列比对的第二条
256:该read是次优的比对结果
512:该read没有通过质量控制
1024:由于PCR或测序错误产生的重复reads
2048:补充匹配的read
共有 0 条评论