python - numpy loadtxt 需要很多时间-6ren

python - numpy loadtxt 需要很多时间

转载作者：太空宇宙更新时间：2023-11-04 06:24:33

24

4

出于某种原因，我将代码分为两部分；第一部分是用 C 编写的，第二部分是用 python 编写的。我在文件中编写了 C 代码的输出并在 python 中使用它作为我的输入，现在我的问题是当我想将文件加载到 numpy 数组中时大约需要 18 分钟，这很长，我需要减少这段时间。 fie 的大小约为 300MB。

写入文件的 C 代码如下:

struct point {
    float fpr;
    float tpr;
    point(float x, float y)
    {
        fpr = x;
        tpr = y;
    }
};
vector<point> current_points;
// filling current_points ......
ofstream files;
files.open ("./allpoints.txt")
for(unsigned int i=0; i<current_points.size(); i++)
            files << current_points[i].fpr << '\t' << current_points[i].tpr << "\n";

在 python 中读取文件就像:

with open("./allpoints.txt") as f:
    just_comb = numpy.loadtxt(f) #The problem is here (took 18 minutes)

allpoints.txt是这样的(可以看到它是2D维度上一些点的坐标):

0.989703    1
0   0
0.0102975   0
0.0102975   0
1   1
0.989703    1
1   1
0   0
0.0102975   0
0.989703    1
0.979405    1
0   0
0.020595    0
0.020595    0
1   1
0.979405    1
1   1
0   0
0.020595    0
0.979405    1
0.969108    1
...
...
...
0   0
0.0308924   0
0.0308924   0
1   1
0.969108    1
1   1
0   0
0.0308924   0
0.969108    1
0.95881 1
0   0

现在我的问题是，有没有更好的方法来将点 vector 存储在文件中(类似于二进制格式)并在 python 中更快地将其读入 2D numpy 数组？

最佳答案

如果您想要预烘焙库解决方案，请使用 HDF5。如果你想要没有依赖性的更简单的东西，请执行以下操作:

files.write(reinterpret_cast<char*>(current_points.data()),
    current_points.size() * sizeof(point));

这将为您提供一个直接写入文件的简单二维 float 数组。然后，您可以使用 [numpy.fromfile()][1] 读取此文件。

关于python - numpy loadtxt 需要很多时间，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28869803/

24

4

0

文章推荐： c - 使用指针反转字符串

文章推荐： python - 自定义 django-admin 模板

文章推荐： c - 在 Winapi 中以编程方式关闭远程机器

具有异国情调的表格式的python loadtxt
我有一个模拟文件，内容如下: 5.2000 -0.01047 -0.02721 0.823400 -0.56669 1.086e-5 2.109e-5 -1.57e-5 -3.12e-5
python - NumPy loadtxt()
我有一个文本文件，我想使用 loadtext() 将其加载到 NumPy 数组中。该文件是制表符分隔的，有时我在最后一个制表符后面有一个值而不是空: Value1\tab\Value2\tab\val
Python - Loadtxt 包含大文件的特定行
我必须在一个巨大的文本文件中获取特定的行。到目前为止我尝试如下。我的目标是提取特定迭代的列，这里每 500 行。但通过继续执行“readlines”，有时我会因为文件的大小(直到 4Gb)而遇到一些崩
Python:loadtxt:从文件中读取数字数据和注释行
我有一个简单的 python 脚本来读取数据文件并绘制它。这是: #!/usr/bin/python import sys import os import matplotlib.pyplot as
python - loadtxt 函数的隐藏错误
我尝试使用convert函数将String转换为float，我使用python3.6: 功能是: def datatype(s): it={'N':0,'L':1,'H':2} ret
python - numpy loadtxt 增量加载以保留内存？
这个问题已经有答案了: numpy Loadtxt function seems to be consuming too much memory (2 个回答) 已关闭 3 年前。我有一个numpy
python - Numpy - loadtxt 并使用日期转换器
我想加载具有以下格式的txt: 20-Sep-13,178.90,185.83,178.56,183.39,13401689 19-Sep-13,170.80,180.47,169.08,177.92
python - np.loadtxt 用于包含多个矩阵的文件
我有一个看起来像这样的文件: some text the grids are 3 x 3 more text matrix marker 1 1 3 2 4 7 4 2 9 1 1 ne
python - numpy.loadtxt 跳过多行
我相信这个线程的标题解释了我在寻找什么。我很想知道跳过多行的语法是什么；我似乎无法在任何地方找到此类信息。最佳答案使用帮助(np.loadtxt)。您会发现 skiprows 参数将允许您跳过前
python - numpy.loadtxt 不读取包含复数的文件
我正在尝试读取一个包含以下形式的复数的文件: data.dat 1.5795219122457646E-11-3.852906516379872E-15i -3.5949335665378405E
python - numpy loadtxt 需要很多时间
出于某种原因，我将代码分为两部分；第一部分是用 C 编写的，第二部分是用 python 编写的。我在文件中编写了 C 代码的输出并在 python 中使用它作为我的输入，现在我的问题是当我想将文件加载
python - numpy.loadtxt - 否定usecols？
我想用 numpy.loadtxt 读取 CSV 文件。我知道我可以使用 usecols 参数指定要读取的列。然而，我真正想要做的是指定一个列列表不来阅读。这是因为我实际上并不知道我的文件将包含多少列
python - Numpy loadtxt 编码
我正在尝试使用 numpy.loadtxt 加载数据...我尝试读取的文件使用 cp1252 编码。是否可以使用 numpy 将编码更改为 cp1252？以下内容 import numpy as n
python - numpy loadtxt 不会导致数组
似乎遇到了一个简单的问题。我正在尝试读取文件中的数组。这些列是整数和字符串的混合；只对第 0、2、3 列感兴趣。 import numpy as np network = np.loadtxt('te
Python:np.loadtxt，读取多个文件
我已经设法让 loadtxt 读取单个文件，但现在我想让它从我拥有的 .list 文件中读取一堆文件。我试着把它放在一个 for 循环中，但我似乎无法让它工作。有人可以帮忙吗？ [row1, row2
python - Numpy.loadtxt 将数据导入为数组数组而不是多维数组
我有一个 csv 文件，它的前三列是这样的 2011,12,25,... 2011,12,26.... 2011,12,27,... ... 这些列基本上是年月日。其他列包含字符串。总共有 100 行
python - numpy.loadtxt() 中的转换错误
我正在尝试使用 python matplotlib 从文本文件中绘制两列，但我得到了 ValueError: invalid literal for float(): 148.000000; 这是我的
python - numpy读取txt错误(loadtxt，genfromtxt)
我想在 python 中读取如下文本文件文本文件示例 {# "Column 4-5 Quantity": "Re/Im Pressure" # "Column 4-5 Units": "" #
python - 一个或多个输入行的 numpy.loadtxt
我有一个数据文件，可能是一行或多行。我使用 numpy.loadtxt 读取它。这具有使我的单行数据成为标量的功能。这是有问题的，因为我想在读入后使用循环。看下面的例子 $ cat file1 1 $
Python - numpy.loadtxt 如何忽略结束逗号？
我正在尝试读取如下所示的文件: 1, 2, 3, 4, 我正在使用以下行: l1,l2 = numpy.loadtxt('file.txt',unpack=True,delimiter=', ') 这

首页

博学

6Ren·AI

商城

python - numpy loadtxt 需要很多时间