GFF文件转换Genbank文件及Mauve多序列比对

前言

有很多软件都可以完成gff文件到genbank文件的转换,如脚本:https://github.com/chundruv/GFF-to-GenBank 但该脚本需要依赖BioPython和BCbio,安装起来较为麻烦,在这里不做推荐。

此处推荐使用更便捷的软件EMBOSS Seqret

一、GFF文件转换为Genbank文件

输入文件:gff3文件和fasta文件

1. 软件安装-EMBOSS

#conda安装 emboss
conda install -c bioconda emboss

2. 软件说明及运行

(base) [hty@master]$ seqret -h
Read and write (return) sequences
Version: EMBOSS:6.6.0.0

   Standard (Mandatory) qualifiers:
  [-sequence]          seqall     (Gapped) sequence(s) filename and optional
                                  format, or reference (input USA)
  [-outseq]            seqoutall  [.] Sequence set(s)
                                  filename and optional format (output USA)

   Additional (Optional) qualifiers: (none)
   Advanced (Unprompted) qualifiers:
   -feature            boolean    Use feature information
   -firstonly          boolean    [N] Read one sequence and stop

   General qualifiers:
   -help               boolean    Report command line options and exit. More
                                  information on associated and general
                                  qualifiers can be found with -help -verbose
#运行命令
seqret -sequence Your.fasta -feature -fformat gff -fopenfile Your.gff3 -osformat genbank -osname_outseq Output_prefix -ofdirectory_outseq gbk_file -auto &
#-sequence Your.fasta 输入fasta文件
#-fopenfile Your.gff3 输入gff3文件
#-osname_outseq Output_prefix 输出文件前缀

二、Mauve进行多序列比对

使用Genbank文件进行多序列比对时,注意Mauve对Genbank文件格式的要求非常严格,Genbank文件后缀需要.gb结尾。

1. 打开Align with progressiveMauve模式

2. 选中需要进行比对的gb文件

【注意事项1】参考基因组需要放在首位。
【注意事项2】Output文件夹需要新建,保证文件夹中无任何文件。
【注意事项3】Output文件路径在新建的文件夹内,路径不能有中文,需要写输入文件前缀。

3. 点击Align并等待结果

版权声明:
作者:admin
链接:https://www.techfm.club/p/84488.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>