HPDB 研究小组 创建中文蛋白质数据库

  蛋白质数据库  输入字词 高级检索  ?


蛋白质结构

蛋白质结构
文件格式

一 介绍

1  编写该文档的目的

2  在版本2.1中有什么新的内容

3  在版本 2.0中有什么新的内容

4  在1996年10月25日PDB文件格式2.0所做的改动

5  PDB格式和内容向导的改动

6  格式描述的基本概念

7  数据格式

8  记录类型

9  记录的表示

10  对数据类型的说明

二 标题部分

1:HEADER(分子类,公布日期、ID号)

2  OBSLTE (注明此ID号已改为新号)

3  TITLE(说明实验方法类型)

4  CAVEAT(可能的错误提示)

5  COMPND(化合物分子组成)

6  SOURCE(化合物来源)

7  KEYWDS(关键词)

8  EXPDTA(测定结构所用的实验方法)

9  AUTHOR(结构测定者)

10 REVDAT(修订日期及相关内容)

11 SPRSDE(已撤销或更改的相关记录)

12 JRNL(发表坐标集的文献)

13 REMARK

REMARK 1(有关文献)

REMARK 2(最大分辨率)

REMARK 3(用到的程序和统计方法)

REMARK 4-999

三 一级结构

  1  DBREF (其他序列库的有关记录)

  2  SEQADV ( PDB与其他记录的出入)

  3  SEQRES (残基序列)

  4  MODRES (对标准残基的修饰)

四 杂因子

  1  HET(非标准残基)

  2  HETNAM(非标准残基的名称)

  HETSNY (非标准残基的同义字)

  4  FORMOL(非标准残基的化学式)

五 二级结构

  1  HELIX(螺旋)

  2  SHEET(折叠片)

  3  TURN(转角)

六 连接注释

  1  SSBOND(二硫键)

  2  LINK(残基间化学键)

  3  HYDBND(氢键)

  4  SLTBRG(盐桥)

  5  CISPEP(顺式残基)

七 晶胞特征及坐标变换

  1  CRYST1(晶胞参数)

  2  ORIGXn(直角-PDB坐标)

  3  SCALEn(直角-部分结晶学坐标)

  4  MTRIXn(非晶相对称)

  5  TVECT(转换因子)

八 坐标部分

  1  MODEL(多亚基时示亚基号)

  2  ATOM(标准基团的原子坐标)

  3  SIGATM(标准差)

  4  ANISOU(温度因子)

  5  SIGUIJ(各种温度因素导致的标准差)

  6  TER(链末端)

  7  HETATM(非标准基团原子坐标)

  8  ENDMDL(亚基结束)

九 连通性部分

   CONECT(原子间的连通性有关记录)

十 簿记

  1  MASTER (版权拥有者)

  2  END(文件结束)

    

 

数据格式                              返回

每个PDB文件可能分割成一系列行,由行终止符终止.在记录文件中每行由80列组成.每条PDB记录末尾标志应该是行终止符.
PDB文件中每行都是自我识别的.每行的前六列存放记录名称,左对齐空格补足.必须和规定的记录名称一致.
PDB文件也可看成是各种记录类型的总和.每个记录类型包括一行或多行又被更深一层分成各字段.
该文件详细描述了每个数据类型,一般包括如下几部分:

  • 综述
  • 记录格式
  • 细节
  • 例子

 

关于蛋白质数据库 | 蛋白质数据库文件格式 | 蛋白质结构讲座

修改日期:  2008年5月3日