gpt4 book ai didi

python - 从蛋白质数据库 (PDB) 文本文件中提取列

转载 作者:太空宇宙 更新时间:2023-11-03 17:50:46 25 4
gpt4 key购买 nike

我想在 Python 中使用 Matplotlib 进行绘图,因此从 PDB 文件(蛋白质数据库)中读取一些数据。我想从文件中提取每一列并将这些列存储在单独的向量中。 PDB 文件由包含文本和 float 的列组成。我对 Matplotlib 非常陌生,我尝试了几种建议的方法来提取这些列,但似乎没有任何效果。提取这些列的最佳方法是什么?我将在稍后阶段加载大量数据,因此如果该方法效率不是太低就好了。

PDB 文件看起来像这样:

ATOM      1  CA  MET A   1      38.012   8.932  -1.253
ATOM 2 CA GLU A 2 39.809 5.652 -1.702
ATOM 3 CA ALA A 3 43.007 5.013 0.368
ATOM 4 CA ALA A 4 41.646 7.577 2.820
ATOM 5 CA HIS A 5 42.611 4.898 5.481
ATOM 6 CA SER A 6 46.191 5.923 5.090
ATOM 7 CA LYS A 7 45.664 9.815 5.134
ATOM 8 CA SER A 8 45.898 12.022 8.181
ATOM 9 CA THR A 9 42.528 13.075 9.570
ATOM 10 CA GLU A 10 43.330 16.633 8.378
ATOM 11 CA GLU A 11 44.171 15.729 4.757
ATOM 12 CA CYS A 12 40.589 14.150 4.745
ATOM 13 CA LEU A 13 38.984 17.314 6.105
ATOM 14 CA ALA A 14 40.633 19.053 3.220
ATOM 15 CA TYR A 15 39.740 16.682 0.505
ATOM 16 CA PHE A 16 36.138 17.421 1.566
ATOM 17 CA GLY A 17 36.536 20.854 2.826
ATOM 18 CA VAL A 18 34.184 20.012 5.553
ATOM 19 CA SER A 19 34.483 20.966 9.177

最佳答案

蛋白质数据库 (pdb) 文件格式是一种文本文件格式,描述蛋白质数据库中保存的分子的三维结构。 pdb 格式相应地提供了蛋白质和核酸结构的描述和注释,包括原子坐标、观察到的侧链旋转异构体、二级结构分配以及原子连接性。我在谷歌上找到了这个。

关于提取列,你也可以在google或wiki上找到答案。

关于python - 从蛋白质数据库 (PDB) 文本文件中提取列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29133422/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com