教你读懂蛋白质数据库文件(PDB文件)

教你读懂蛋白质数据库文件(PDB文件)回答网友提问:什么是HETATM?  并教你读懂蛋白质的PDB文件  作者:小米HETATM非标准基团原子坐标,这个是PDB数据库原子坐标的一种记录格式。如HETATM460PPO4100-2.5027.5874.2251.0024.59PHETATM461O1PO4100-3.3206.5325.0031.00

大家好,又见面了,我是你们的朋友全栈君。

回答网友提问:什么是HETATM?

   

并教你读懂蛋白质的PDB文件

   

作者:小米

HETATM 非标准基团原子坐标,这个是PDB数据库原子坐标的一种记录格式。如

HETATM 460 P PO4 100 -2.502 7.587 4.225 1.00 24.59 P

HETATM 461 O1 PO4 100 -3.320 6.532 5.003 1.00 21.58 O

HETATM 462 O2 PO4 100 -2.659 9.016 4.703 1.00 20.93 O

HETATM 463 O3 PO4 100 -1.038 7.162 4.308 1.00 22.74 O

HETATM 464 O4 PO4 100 -3.034 7.618 2.801 1.00 23.47 O 

HETATM 465 O HOH 103 14.704 1.498 15.520 0.80 29.62 O

HETATM 466 O HOH 105 8.954 -3.596 13.444 1.00 28.63 O

HETATM 467 O HOH 108 3.055 0.876 7.712 0.80 16.06 O

HETATM 468 O HOH 110 3.490 -2.454 1.142 0.95 9.35 O

英文在PDB file 中的说明:The HETATM records present the atomic coordinate records for atoms within “non-standard” groups. These records are used for water molecules and atoms presented in HET groups.


附录:PDB数据库原子坐标记录格式

一 标题部分

1 HEADER(分子类,公布日期、ID号)

2 OBSLTE (注明此ID号已改为新号)

3 TITLE(说明实验方法类型)

4 CAVEAT(可能的错误提示)

5 COMPND(化合物分子组成)

6 SOURCE(化合物来源)

7 KEYWDS(关键词)

8 EXPDTA(测定结构所用的实验方法)

9 AUTHOR(结构测定者)

10 REVDAT(修订日期及相关内容)

11 SPRSDE(已撤销或更改的相关记录)

12 JRNL(发表坐标集的文献)

13 REMARK

REMARK 1(有关文献)

REMARK 2(最大分辨率)

REMARK 3(用到的程序和统计方法)

REMARK 4-999

二 一级结构

1 DBREF (其他序列库的有关记录)

2 SEQADV ( PDB与其他记录的出入)

3 SEQRES (残基序列)

4 MODRES (对标准残基的修饰)

三 杂因子

1 HET(非标准残基)

2 HETNAM(非标准残基的名称)

3 HETSNY (非标准残基的同义字)

4 FORMOL(非标准残基的化学式)

四 二级结构

1 HELIX(螺旋)

2 SHEET(折叠片)

3 TURN(转角)

五 连接注释

1 SSBOND(二硫键)

2 LINK(残基间化学键)

3 HYDBND(氢键)

4 SLTBRG(盐桥)

5 CISPEP(顺式残基)

六 晶胞特征及坐标变换

1 CRYST1(晶胞参数)

2 ORIGXn(直角-PDB坐标)

3 SCALEn(直角-部分结晶学坐标)

4 MTRIXn(非晶相对称)

5 TVECT(转换因子)

七 坐标部分

1 MODEL(多亚基时示亚基号)

2 ATOM(标准基团的原子坐标)

3 SIGATM(标准差)

4 ANISOU(温度因子)

5 SIGUIJ(各种温度因素导致的标准差)

6 TER(链末端)

7 HETATM(非标准基团原子坐标)

8 ENDMDL(亚基结束)

八 连通性部分

CONECT(原子间的连通性有关记录)

九 簿记

1 MASTER (版权拥有者)

2 END(文件结束)

 

 

 

 

 

 

 

 

PDB格式文件对大部分做模拟和计算的人来说都很熟悉,但其中各个参数的意义很多人并不是很了解。从网上搜集了一些文章,结合自己的知识来对PDB文件中各个参数的意义做个解释:

REMARK

该记录用来记述结构优化的方法和相关统计数据。如用Refmac进行结构优化,该记录将自动插入输出的PDB。

CRYST1 (NMR除外)

该记录用来记述晶胞结构参数 (a, b, c, α, β, γ, 空间群) 以及 Z值 (单位结构中的聚和链数)。

SCALEn(n = 1, 2, 3) (NMR除外)

该记录介绍数据中直角坐标向部分晶体学坐标的转换。

ATOM

该记录记述了标准氨基酸以及核酸的原子名,残基名,直角坐标,占有率,温度因子等信息。

HETATM

该记录记述了标准氨基酸以及核酸以外的化合物的原子名,残基名,直角坐标,占有率,温度因子等信息。

TER

该记录表示链的末端。在每个聚合链的末端都必须有TER记录,但是由于无序序列而造成的链的中断处不需要该记录。

MODEL

当一个PDB文件中包含多个结构时(例:NMR结构解析),该记录出现在各个模型的第一行。 MODEL记录行的第11-14列上记入模型序号。序号从1开始顺序记入,在11-14列中从右起写。比如说有30个模型,则第1至9号模型,该行的7-13列空白,在14列上记入1-9的数字;第10-30号模型,该行的7-12列空白,13-14列上记入 10-30的数字。

ENDMDL

与MODEL记录成对出现,记述在各模型的链末端的TER记录之后。

END

该记录标志PDB文件的结束,是必需的记录。

B-factoer

The B-factor (or temperature factor) is an indicator of thermal motion about an atom. However, it should be pointed out that the B-factor is a mix of real thermal displacement, static disorder (multiple but defined conformations) and dynamic disorder (no defined conformation), and all the overlap between these definitions.

是晶体学中的一个重要参数,晶体学中结构因子可以表达为坐标x , y, z与Bj 因子的函数。物理学上对于Bj 的表征有很多理论模型, 最成功的是由Debye 和Waller 提出的. 将固体内振荡的量子本质计算在内后,他们将Bj 表征为绝对温度T 和其他各基本参数的函数。由此可见, Bj 与原子的质量等基本性质有关,也与实验温度有关。

B 因子体现了晶体中原子电子密度的“模糊度”( diffusion) , 这个“模糊度”实际上反映了蛋白质分子在晶体中的构象状态. B 因子越高,“模糊度”越大,相应部位的构象就越不稳定。在晶体学数据中, B 因子一般是以原子为单位给出的,我们可以换算成相应残基的B 因子,从而分析残基的构象稳定性1) . 另外,计算出的B 因子中实际上包含了实验中的很多因素,如晶体结构测定的实验误差等,精度高的晶体结构数据提供较可靠的B 因子数据。

此外,另外温度因子还和占有率相关,如果本身结构解析过程中占有率低,也会导致温度因子升高。这个时候只能说是X-ray收集数据的时候这个地方的信号比较弱,而和结构本身的构象如何,没有关系。

PDB 中的晶体学数据是以原子为单位的,它所给出的B 因子是相对于每个原子的,统计中,首先将原子的B 因子换算成残基的B 因子,即把每个残基所有原子的B 因子取平均值。由于蛋白质分子表面残基的运动性比较大, B 因子相对较高, 所以在统计中除去了这部分残基,具体方法是将数据中B 因子高的残基去掉10 % ,对剩下的残基进行统计,计算平均值。

R-facoter

In overview, the R-factor is a measure of how well a particular model structure fits the observed electron density. Or simply, “a measure of agreement between the crystallographic model and the original X-ray diffraction data”.

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/137132.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • php rdkafka_php rdkafka

    php rdkafka_php rdkafkaKafka是一种分布式的,基于发布/订阅的消息系统。在使用PHP处理Kafka消息的时候需要使用一个PHP的扩展php-rdkafka下面将介绍一下如何在Linux/MacOS下安装php-rdkafka在使用php-rdkafka之前需要先安装好librdkafkaisaClibraryimplementationoftheApacheK…

    2022年10月14日
  • C语言学习——字符串与整数、浮点数、无符号整数之间的转换常用函数

    C语言学习——字符串与整数、浮点数、无符号整数之间的转换常用函数atof(将字符串转换成浮点型数)表头文件 #include <stdlib.h>定义函数 double atof(const char nptr);函数说明atof()会扫描参数nptr字符串,跳过前面的空格字符,直到遇上数字或正负符号才开始做转换,而再遇到非数字或字符串结束时(’’)才结 束转换,并将结果返回。参数nptr字符串可包含正负号、小数点或E(e)来表示指数部分,…

  • Ubuntu下安装VSCODE「建议收藏」

    Ubuntu下安装VSCODE「建议收藏」方式一:应用中心安装首先在ubuntu桌面找到应用中心打开在软件中心中,搜索VisualStudioCode当然上面是理想情况,这种图是我在网上搜的。。。我自己的应用中心并不能搜索到VSCODE能找到就在页面中直接选择安装方式二:安装包安装1.从vscode官网下载最新版本,deb包下载地址:https://code.visualstudio.com/docs?dv=linux64当然由于是外网,可能下载速度极慢,这是我下载后上传到百度云的链接,官网下载..

  • ffmpeg avformat_open_input返回失败,错误码-10049

    ffmpeg avformat_open_input返回失败,错误码-10049ffmpegavformat_open_input失败,返回错误码-10049,错误描述:Errornumber-10049occurred调试代码,找到如果设置了time_out参数,就会失败,不设置就没问题,具体原因还没有找到,备注此问题,以待后续继续分析源代码:av_register_all();avformat_network_init();AVFormatCo…

  • 教你如何免费使用云服务器「建议收藏」

    教你如何免费使用云服务器「建议收藏」深度学习没有GPU?!!教你如何白嫖服务器一、声明二、引言二、如何获取三、操作步骤3.1文件传输软件的安装3.3远程操控软件的安装四、资料软件分享五、总结教你如何白嫖服务器)一、声明本文章没有广告用意,只是觉得好用分享给大家。同时做个简单的记录。二、引言因为电脑只有CPU,算力不够,以及很多深度学习教程以及模型都是在GPU环境下进行,所以一直想着怎么样才能白嫖到服务器,毕竟云服务器不便宜,要是经常用的话,对学生党来说是一笔不小的支出。有一天经过群友推荐终于找到了一个可以免费试用200元的云服

  • 什么是linux Qt[通俗易懂]

    什么是linux Qt[通俗易懂]Qt是一个跨平台的C++图形用户界面库,由挪威TrollTech公司出品,目前包括Qt,基于Framebuffer的QtEmbedded,快速开发工具QtDesigner,国际化工具QtLinguist等部分Qt支持所有Unix系统,当然也包括Linux,还支持WinNT/Win2k,Win95/98平台。

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号