简 介
蛋白质的结构状态包括有序的球状结构域以及本质上无序的蛋白质区域,这些区域作为高度灵活的构象集合体孤立存在。已经开发了各种计算工具来区分基于氨基酸序列的有序和无序片段。然而,IDR 的性质也可以取决于各种条件,包括与球状蛋白伴侣的结合或环境因素,如氧化还原电位。这些案例为无序段的计算表征提供了进一步的挑战。因此,提出了 IUPred2A,这是一个组合的web界面,允许生成基于 IUPred2 对有序和无序残基的预测的能量估计,并通过 ANCHOR2 对无序结合区进行预测。更新后的 web 服务器保留了原始程序的健壮性,但提供了几个新功能。虽然只对 IUPred 实现了较小的错误修复,但下一个版本的 ANCHOR 通过在新数据集上优化的新架构和参数得到了显着改进。此外,氧化还原敏感区域也可以通过一个新的实验特征来突出。
文件准备
这个输入文件只有一个文件可以是蛋白序列文件,例如:
>sp|Q14061|COX17_HUMAN Cytochrome c oxidase copper chaperone OS=Homo sapiens GN=COX17 PE=1 SV=2
MPGLVDSNPAPPESQEKKPLKPCCACPETKKARDACIIEKGEEHCGHLIEAHKECMRALG
FKI
在线分析
在线网址IUPred2A,在线使用还是非常简单,序列少可以优先选择在线操作。
线上分析对数据量要求有一定局限性:
上传多条序列FASTA文件最大不超过1MB。
在线分析有三种方式,一种是输入SWISS-PROT/TrEMBL标识符或accession number,一种是上传fasta文件,最后一个就是直接粘贴蛋白序列。
粘贴序列测试结果:
SWISS-PROT/TrEMBL标识符或accession number测试结果:
运行完成之后会出现结果页面,右上角可以下载结果。
-
IUPred2A预测大部分N端区域和C端区域是无序的。
-
ANCHOR2预测了N端和C端区域的无序结合区。
-
有三个Pfam注释。
-
根据ELM注释,已知的基序可以在多个位置找到。
-
该蛋白有多个PTM位点。
-
该蛋白包含两个基于DIBS数据库注释的实验验证的无序区域。
-
有1个PDB结构对应于这种蛋白质,覆盖了蛋白质的不同部分。
-
虽然结构的存在通常被解释为有序的指示,但这种蛋白质表明它可能更复杂。
-
中间部分也有各种已解结构。
-
然而,在已知结构中缺乏电子密度证实了预测的无序峰值。
-
C端区域具有单个PDB结构PDB覆盖。
看一下txt格式的结果:
# IUPred2A: context-dependent prediction of protein disorder as a function of redox state and protein binding
# Balint Meszaros, Gabor Erdos, Zsuzsanna Dosztanyi
# Nucleic Acids Research 2018, Submitted
# IUPred2 type: long
# POS AMINO ACID IUPRED2 REDOX PLUS IUPRED2 REDOX MINUS REDOX REGION
1 M 0.6991 0.8792 0
2 P 0.7505 0.9106 0
3 G 0.7755 0.9211 0
4 L 0.7799 0.9190 0
5 V 0.8013 0.9346 0
6 D 0.8198 0.9415 0
7 S 0.8125 0.9381 0
8 N 0.8050 0.9329 0
9 P 0.8279 0.9457 0
10 A 0.7672 0.9126 0
本地分析
软件包安装
首先下载软件包,这个 iupred2a.tar.gz 软件包基于Python3.6版本下载的时候注意一下需要输入带有.edu类后缀的邮箱,否则也下载不了,安装操作都差不多哈。
安装时很简单,就是直接解压即可,然后运行时使用python3.
tar -xzf iupred2a.tar.gz
测试安装是否成功:
python3 ./iupred2a/iupred2a.py -h
Wrong iupred2 option -h!
Usage: ./iupred2a/iupred2a.py (options) (seqfile) (iupred type)
Available types: "long", "short", "glob"
Options
-d str - Location of data directory (default='./')
-a - Enable ANCHOR2 predition
实际操作
1. 参数说明
-d 数据目录位置;
-a 启用ANCHOR2预测;
iupred类型 “long”,“short”, 或“glob”分别用于预测长或短的紊乱或球状区域.
2. 实际操作命令如下:
测试例子来自在线分析上的一个序列,并且启用ANCHOR2预测:
python3 ./iupred2a/iupred2a.py -a infile.fasta long >iupred2a_result.long.txt
python3 ./iupred2a/iupred2a.py -a infile.fasta short > iupred2a_result.short.txt
python3 ./iupred2a/iupred2a.py -a infile.fasta glob > iupred2a_result.glob.txt
结果解读
Reference
-
Mészáros B, Erdos G, Dosztányi Z. IUPred2A: context-dependent prediction of protein disorder as a function of redox state and protein binding. Nucleic Acids Res. 2018 Jul 2;46(W1):W329-W337. doi: 10.1093/nar/gky384. PMID: 29860432; PMCID: PMC6030935.
-
Erdős G, Dosztányi Z. Analyzing Protein Disorder with IUPred2A. Curr Protoc Bioinformatics. 2020 Jun;70(1):e99. doi: 10.1002/cpbi.99. PMID: 32237272.
桓峰基因,铸造成功的您!
未来桓峰基因公众号将不间断的推出单细胞系列生信分析教程,
敬请期待!!
桓峰基因官网正式上线,请大家多多关注,还有很多不足之处,大家多多指正!http://www.kyohogene.com/
桓峰基因和投必得合作,文章润色优惠85折,需要文章润色的老师可以直接到网站输入领取桓峰基因专属优惠券码:KYOHOGENE,然后上传,付款时选择桓峰基因优惠券即可享受85折优惠哦!https://www.topeditsci.com/
桓峰基因公众号推出生信工具教程,有需要生信的老师可以联系我们!
SEQ 2. 生信工具之GFF和GTF互相转换(gffread)
文章评论