蛋白质序列比对与蛋白质二级结构预测
#什么是蛋白质二级结构?
按照结构层次划分,蛋白质结构可以分为一级结构、二级结构、三级结构、四级结构:
蛋白质二级结构(secondary structure of protein)是指多肽主链骨架原子沿一定的轴盘旋或折叠而形成的特定的构象,即肽链主链骨架原子的空间位置排布,不涉及氨基酸残基侧链。 [1] 蛋白质二级结构的主要形式包括α-螺旋、β-折叠、β-转角、Ω环和无规卷曲。 [1] 由于蛋白质的分子量较大,因此,一个蛋白质分子的不同肽段可含有不同形式的二级结构。 [1] 维持二级结构的主要作用力为氢键。 [2] 一种蛋白质的二级结构并非单纯的α螺旋或β折叠结构,而是这些不同类型构象的组合,只是不同蛋白质各占多少不同而已。 [1]
(来源百度百科https://baike.baidu.com/item/%E8%9B%8B%E7%99%BD%E8%B4%A8%E4%BA%8C%E7%BA%A7%E7%BB%93%E6%9E%84/1479025)
##使用ClustalX,SWISS-MODEL,PDB,ESPript3.0对蛋白比对文件进行美化并预测二级结构
#SWISS-MODEL(https://swissmodel.expasy.org/)获得拟比对蛋白的同源蛋白PDB文件(针对拟比对蛋白中不存在具有PDB文件的蛋白的情况,如果拟比对蛋白中存在蛋白具有已知PDB文件的话,可直接去PDB网站下载)
操作顺序如下:Start Modelling-Upload Target Sequence File-Search For Templates- Modelling-Upload Target Sequence File-Search For Templates-获得同源蛋白列表-选择同源性最高的蛋白(同源性大于35%)并点击相关条目-获得PDB号(SMTL ID)-去PDB数据库下载PDB文件或者直接在当前页面进行下载PDB文件
#在PDB数据库(https://www.rcsb.org/)下载同源蛋白的PDB文件
操作顺序如下:Search-输入PDB号-Download Files-下载FASTA和PDB文件
#ESPript3.0(http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi)美化蛋白比对文件并添加二级结构
操作顺序如下:蛋白序列比对文件.aln文件(包括上述提供PDB文件的蛋白序列,ClustalX比对获得)上传-下载的同源蛋白结构文件.pdb 文件上传-可设置其他参数进行个性化设置,这里不展开讲解-SUBMIT
重点提示:
点击SUBMIT报错( " Fatal error: secondary structure elements are certainly misplaced ".)的话,可以在报错后,在提交页面根据Defining groups的Guidence中的顺序把PDB文件来自的蛋白序列放在第一位,然后重新提交(见F.A.Q. - ESPript 3 (ibcp.fr);其他常见问题也可在此查询)
然后文件就新鲜出炉啦~
共有 0 条评论