Python (numpy) 读取混合格式的文本文件-6ren

Python (numpy) 读取混合格式的文本文件

转载作者：太空宇宙更新时间：2023-11-03 13:19:45

24

4

我有成千上万个这样的文件，我想提取对应于原子 ['CG', 'CD1', 'CD2', 'CE1', 'CE2 ', 'CZ'],

ATOM      1  CG  TOLU    1      -0.437  -0.756   1.802  1.00  1.99      PRO0
ATOM      2  HG  TOLU    1      -0.689  -1.123   2.786  1.00  0.00      PRO0
ATOM      3  CD1 TOLU    1       0.041  -1.623   0.811  1.00  1.99      PRO0
ATOM      4  HD1 TOLU    1       0.331  -2.603   1.162  1.00  0.00      PRO0
ATOM      5  CD2 TOLU    1      -0.692   0.547   1.352  1.00  1.99      PRO0
ATOM      6  HD2 TOLU    1      -1.131   1.264   2.030  1.00  0.00      PRO0
ATOM      7  CE1 TOLU    1       0.246  -1.276  -0.504  1.00  1.99      PRO0
ATOM      8  HE1 TOLU    1       0.596  -2.073  -1.144  1.00  0.00      PRO0
ATOM      9  CE2 TOLU    1      -0.331   0.991   0.063  1.00  1.99      PRO0
ATOM     10  HE2 TOLU    1      -0.565   2.030  -0.117  1.00  0.00      PRO0
ATOM     11  CZ  TOLU    1       0.136   0.076  -0.919  1.00  1.99      PRO0
ATOM     12  CT  TOLU    1       0.561   0.474  -2.282  1.00  0.00      PRO0
ATOM     13  H11 TOLU    1       0.529  -0.410  -2.955  1.00  0.00      PRO0
ATOM     14  H12 TOLU    1       1.574   0.930  -2.294  1.00  0.00      PRO0
ATOM     15  H13 TOLU    1      -0.203   1.165  -2.699  1.00  0.00      PRO0
ATOM     16  CG  TOLU    2       5.140   1.762  -1.390  1.00  1.99      PRO0
ATOM     17  HG  TOLU    2       5.815   1.717  -2.231  1.00  0.00      PRO0
ATOM     18  CD1 TOLU    2       4.578   0.647  -0.862  1.00  1.99      PRO0
ATOM     19  HD1 TOLU    2       4.835  -0.329  -1.246  1.00  0.00      PRO0
ATOM     20  CD2 TOLU    2       4.786   3.044  -0.824  1.00  1.99      PRO0
ATOM     21  HD2 TOLU    2       5.184   3.982  -1.181  1.00  0.00      PRO0
ATOM     22  CE1 TOLU    2       3.734   0.667   0.248  1.00  1.99      PRO0
ATOM     23  HE1 TOLU    2       3.131  -0.167   0.574  1.00  0.00      PRO0
ATOM     24  CE2 TOLU    2       4.042   3.068   0.321  1.00  1.99      PRO0
ATOM     25  HE2 TOLU    2       3.753   3.969   0.841  1.00  0.00      PRO0
ATOM     26  CZ  TOLU    2       3.465   1.886   0.893  1.00  1.99      PRO0
ATOM     27  CT  TOLU    2       2.501   1.806   2.157  1.00  0.00      PRO0
ATOM     28  H11 TOLU    2       2.361   0.712   2.283  1.00  0.00      PRO0
ATOM     29  H12 TOLU    2       1.490   2.181   1.890  1.00  0.00      PRO0
ATOM     30  H13 TOLU    2       2.845   2.513   2.943  1.00  0.00      PRO0
TER
END

并注意每个提到的原子都有两行。因此，我认为两个 12 键的字典最符合我的目标，就像这样

{1: {'CG':(0,0,0), 'CD1':(0,0,0), 'CD2':(0,0,0), 'CE1':(0,0,0), 'CE2':(0,0,0), 'CZ':(0,0,0)},
2: {'CG':(0,0,0), 'CD1':(0,0,0), 'CD2':(0,0,0), 'CE1':(0,0,0), 'CE2':(0,0,0), 'CZ':(0,0,0)}}

第一个键 (1, 2) 指的是第 5 列。

你能告诉我一种可靠的方法来读取文件并将每个值元组分配到字典中的正确位置吗？我可以使用多个 if 条件来做到这一点，但我认为必须有更好的方法(也许使用 numpy)

最佳答案

解析文件的一种方法是 numpy.genfromtxt():

keys = set(['CG', 'CD1', 'CD2', 'CE1', 'CE2', 'CZ'])
data = numpy.genfromtxt("input", usecols=(2, 4, 5, 6, 7), 
                        dtype=["S3", "i", "d", "d", "d"], skip_footer=2)
data = [row for row in data if row[0] in keys]

在此之后，data 将是

[('CG', 1, -0.437, -0.756, 1.802),
 ('CD1', 1, 0.041, -1.623, 0.811),
 ('CD2', 1, -0.692, 0.547, 1.352),
 ('CE1', 1, 0.246, -1.276, -0.504),
 ('CE2', 1, -0.331, 0.991, 0.063),
 ('CZ', 1, 0.136, 0.076, -0.919),
 ('CG', 2, 5.14, 1.762, -1.39),
 ('CD1', 2, 4.578, 0.647, -0.862),
 ('CD2', 2, 4.786, 3.044, -0.824),
 ('CE1', 2, 3.734, 0.667, 0.248),
 ('CE2', 2, 4.042, 3.068, 0.321),
 ('CZ', 2, 3.465, 1.886, 0.893)]

很容易将数据放入您现在需要的任何字典格式。

关于Python (numpy) 读取混合格式的文本文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18277183/

24

4

0

文章推荐： python - 从 5 行的列表列表中获取所有元素

文章推荐： python - 正则表达式在python中查找特定模式

c++ 将 printf 与 wprintf 混合(或将 cout 与 wcout 混合)
我知道您不应该将打印与 printf,cout 和 wprintf,wcout 混合使用，但是很难找到一个好的答案，为什么以及是否可以绕过它。问题是我使用了一个用 printf 打印的外部库，而我自己
Python多重继承/混合
我有以下问题: class A: animal = 'gerbil' def __init__(self): self.result = self.calculate_
OpenGL 混合 - 用不同的颜色填充交叉点
我在屏幕上渲染了一堆形状(多边形)，我没有使用深度测试。我只是希望这些形状在绘制在空白区域时使用自己的颜色，并且在绘制到任何非空区域时使用红色像素，即在我的情况下绘制在另一个多边形上。这里的问题实
grails - Groovy 混合？
我正在尝试在我的 Groovy/Grails 应用程序中混入一个类，我正在使用 the syntax defined in the docs ，但我不断收到错误消息。我有一个如下所示的域类: cla
OpenGL Alpha 混合
我已经找到了 5349574673 个关于 Alpha 混合的页面，但我仍然无法获得想要的结果。我正在尝试使用 opengl 使 gif/png 文件正确显示(具有透明度/半透明度)。这是我的初始化
javascript - 记录通过函数生成的类(混合)
我正在尝试记录以下代码，但我似乎无法让 JSDoc 记录该类，甚至无法引用它的存在。 // SomeMixin.js export default superclass => class SomeMi
scala - 家庭多态性+混合？
我有一个类型家族，我想使用 mixin 以模块化方式“丰富”它们。例如: trait Family { self => trait Dog { def dogname:String
ios - 混合 Storyboard中的单元和以编程方式创建的单元
我在 Storyboard中有 Collection View 。我在 Storyboard中有一部分单元格，还有我以编程方式创建的部分单元格。我应该在 sizeForItemAtIndexPath
c++ - 混合/修改数组访问
我有一个字节数组，我想更改它的访问方式。这是数组: char bytes[100]; 我想要另一个数组来改变原始数组的访问方式。如果我们可以将引用放在数组中，它看起来像这样: char& bytes_
c++ - c和c++混合
我需要从 c 文件调用 cpp 方法。我为此编写了这个界面.. cpp文件 extern "C" void C_Test(int p){ Class::CPP_Test(p); } c文件
移动和主要 CSS 混合
我的网站有两份 CSS 表，一份是主 CSS，一份是移动 CSS。问题是在移动设备(iPhone、Android)上查看时，两个样式表会混淆。例如，在 iPhone 上查看网站时，会应用主样式表中的某
Python Bokeh - 混合
维护人员的说明:此问题涉及已过时的 bokeh.charts API，该 API 已于多年前删除。有关使用现代 Bokeh 创建各种条形图的信息，请参阅: https://docs.bokeh.org
ios - 从另一个层中减去层，混合？
在下图中，蓝色圆圈仅用于调试目的。我的目标是蓝色圆圈后面的每一层都应该是透明的。我只想保持蓝色圆圈外面的可见。这是用 swift 编写的代码: let croissantView = UIV
SQL - 混合 AND 和 OR
我不是 SQL 专家。我正在使用 SQL Server 2005，我正在尝试弄清楚如何构造一个查询，以便它可以满足多种要求。我有两个表定义如下: Classroom - ID - Departme
完全不透明或透明的 openGL Alpha 混合
原创: 我之前问过这个问题，但我最初的例子有点不完整，我想我现在可以更具体地说明我的问题。对于上下文，我在旧的 Apple mac 计算机上使用 openGL 3.3 并尝试渲染四边形的重叠层。每个
YAML:将内联与同一对象的常规 map 混合
是否可以将内联(类似 json)映射与同一对象的常规映射定义混合使用？考虑以下示例: person: {age: 32, weight: 82} name: foo 生成的人应具有给定的年龄、体
inheritance - 如何在子类中将多个父类构造函数与 val 混合
假设我有一个 Parent 类，它有四个字段 A、B、C 和 D，这样 C 和 D 可以选择传递或使用默认实现进行初始化: open class Parent(val a: A, val b: B,
svn - 将存储库与 SVN 混合
我正在使用 symphony (1.4) 框架在 PHP 中开发一个 Web 应用程序。该代码使用 SVN 进行版本控制。在此网络应用程序中，我们所有客户共享一个共同的基础，以及一些专门为每个客户创建
Qt 小部件与顶部的 QML 混合
我想使用两个小部件(一次一个)作为我的应用程序的基础/背景，上面有一个 QML UI 和一个无边框窗口。它应该看起来像这样: 基于 OpenGL 的扫描组件通过窗口句柄操作的 3D 可视化组件多个
javascript - 混合 Angular 应用程序中的变化检测非常慢
我们有一个混合的 AngularJS/Angular 8 应用程序，并且我们不断遇到来自不同版本框架的组件之间的变化检测非常慢的问题。到目前为止，我们只在 Angular 组件中使用 AngularJ

首页

博学

6Ren·AI

商城

Python (numpy) 读取混合格式的文本文件