新手写python脚本提取最长转录本序列2.0

新手写python脚本提取最长转录本序列2.0 原始蛋白序列长这个样子: 写脚本的具体思路: 1.创建转录本ID和序列的字典(键值对) 2.提取每个转录本的序列长度,形成三列,第一列是转录本ID,第二列是转录本长度,第三列是gene ID 3.这一步准备对上一步生成的文件按照基因ID和序列长度进行排序 4.创建新的字典(key是gene id,value是排序后的转录本ID),然后print(list_values),第一列就是最长转录本ID 5.创建一个空的out.fasta文件,通过longest_pep_id.txt得到最长转录本序列 注意:在第一步创建字典过程中,要让key变得美观一点,将>后面的header修改为>Apun_evm.model.utg000023l.1107.1这种样子,即转录本后面的注释全部删掉(从第一个空格往后全部删除),利用正则表达式name=re.sub(" .*$","",n

新手写python脚本提取最长转录本序列2.0最先出现在Python成神之路

版权声明:
作者:zhangchen
链接:https://www.techfm.club/p/7875.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>