蛋白质结构
蛋白质结构文件格式
一 介绍
1 编写该文档的目的
2 在版本2.1中有什么新的内容
3 在版本 2.0中有什么新的内容
4 在1996年10月25日PDB文件格式2.0所做的改动
5 PDB格式和内容向导的改动
6 格式描述的基本概念
7 数据格式
8 记录类型
9 记录的表示
10 对数据类型的说明
二 标题部分
1:HEADER(分子类,公布日期、ID号)
2 OBSLTE (注明此ID号已改为新号)
3 TITLE(说明实验方法类型)
4 CAVEAT(可能的错误提示)
5 COMPND(化合物分子组成)
6 SOURCE(化合物来源)
7 KEYWDS(关键词)
8 EXPDTA(测定结构所用的实验方法)
9 AUTHOR(结构测定者)
10 REVDAT(修订日期及相关内容)
11 SPRSDE(已撤销或更改的相关记录)
12 JRNL(发表坐标集的文献)
13 REMARK
REMARK 1(有关文献)
REMARK 2(最大分辨率)
REMARK 3(用到的程序和统计方法)
REMARK 4-999
三 一级结构
1 DBREF (其他序列库的有关记录)
2 SEQADV ( PDB与其他记录的出入)
3 SEQRES (残基序列)
4 MODRES (对标准残基的修饰)
四 杂因子
1 HET(非标准残基)
2 HETNAM(非标准残基的名称)
3 HETSNY (非标准残基的同义字)
4 FORMOL(非标准残基的化学式)
五 二级结构
1 HELIX(螺旋)
2 SHEET(折叠片)
3 TURN(转角)
六 连接注释
1 SSBOND(二硫键)
2 LINK(残基间化学键)
3 HYDBND(氢键)
4 SLTBRG(盐桥)
5 CISPEP(顺式残基)
七 晶胞特征及坐标变换
1 CRYST1(晶胞参数)
2 ORIGXn(直角-PDB坐标)
3 SCALEn(直角-部分结晶学坐标)
4 MTRIXn(非晶相对称)
5 TVECT(转换因子)
八 坐标部分
1 MODEL(多亚基时示亚基号)
2 ATOM(标准基团的原子坐标)
3 SIGATM(标准差)
4 ANISOU(温度因子)
5 SIGUIJ(各种温度因素导致的标准差)
6 TER(链末端)
7 HETATM(非标准基团原子坐标)
8 ENDMDL(亚基结束)
九 连通性部分
CONECT(原子间的连通性有关记录)
十 簿记
1 MASTER (版权拥有者)
2 END(文件结束)
数据格式 返回
每个PDB文件可能分割成一系列行,由行终止符终止.在记录文件中每行由80列组成.每条PDB记录末尾标志应该是行终止符. PDB文件中每行都是自我识别的.每行的前六列存放记录名称,左对齐空格补足.必须和规定的记录名称一致. PDB文件也可看成是各种记录类型的总和.每个记录类型包括一行或多行又被更深一层分成各字段. 该文件详细描述了每个数据类型,一般包括如下几部分:
关于蛋白质数据库 | 蛋白质数据库文件格式 | 蛋白质结构讲座
修改日期: 2008年5月3日