python - 替代 npz 文件？-6ren

python - 替代 npz 文件？

转载作者：太空宇宙更新时间：2023-11-04 05:51:37

28

4

我使用以 Python .npz 格式存储的数组。我有很多这样的文件，它们都共享相同的公共(public)结构:文件名 my_file_var1_var2_var3.npz 包含以下项目(所有数组都是 32 位 float ):

一个二维数组(N=11，Ns=2000)
一个二维数组 (12, N )
一个二维数组 ( 300, N )
一个二维数组 ( 300, Ns )
一个花车
一个整数

拥有超过 1000 个文件是非常烦人的，而且每个文件最终都会占用大约 4Mb。我在想将它们转移到一个容器中会很好，比如 HDF5/Pytables 或类似的。不同的数组只是数组，没有优先顺序或任何东西(它们实际上是矩阵或将对其进行操作的向量堆栈)。同时需要每个文件名的所有数组。

是否有任何建议可以更好地检索与 var1、var2 和 var3 关联的数组，即可移植和高效存储

最佳答案

使用 PyTables 以 HDF5 格式存储数据集在这里绝对有意义(例如，参见 example)。

它不仅会将您的所有数据放在同一个容器中，而且您还可以使用 BLOSC 进行压缩、高效查询以及可能更快的读/写访问。

因为您的项目具有可变形状，所以您不能将所有相同类型的项目放在一个公共(public)数组中。所以你有几个选择，

将每个数组保存为单独的 HDF5 节点
如果 N 是可变的但有一些合理的最大值 N_max(例如 20 或 30)，您可以创建大小为 (number_of_items, . .., Nmax) 并默认用零填充不需要的元素。令人惊讶的是，如果您需要同时查询所有项目，这可能会更有效率，而且如果您使用压缩，您将不会看到大小开销。

关于python - 替代 npz 文件？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29965176/

28

4

0

文章推荐： c++ - mmap 损坏，malloc 是否覆盖内存上的元素

文章推荐：在C中创建和写入多个txt文件

文章推荐： c - 为什么要重新加载 C 中的静态局部变量？

python - 如何查看 npz 文件中的数据对象内容？
我正在使用 Spyder IDE 和 Python 2.7。我有一个名为 data.npz 的 npz 文件，它是给我的。我想将此文件加载到 Spyder 并查看其中的内容。首先，我已经这样做了:
numpy - 为 NPZ 文件赋值
有人可以向我解释为什么这不起作用: 步骤 1) 创建一个简单的 NPZ 文件 import numpy as np a1 = np.zeros((3,2), dtype=np.double) np.s
python - 以多线程方式加载多个 npz 文件
我有几个 .npz 文件。所有 .npz 文件都具有相同的结构:每个文件仅包含两个变量，且变量名始终相同。截至目前，我只需循环所有 .npz 文件，检索两个变量值并将它们附加到某个全局变量中: # L
python - 替代 npz 文件？
我使用以 Python .npz 格式存储的数组。我有很多这样的文件，它们都共享相同的公共(public)结构:文件名 my_file_var1_var2_var3.npz 包含以下项目(所有数组都是
python - 无法从 npz 文件加载非数组
我需要将几个 numpy 数组和 Python 对象保存到磁盘。我想完全最小化 I/O。我不介意加载器或保存器是否必须在内存中进行任何提升，但I/O 占用(实际访问)应该是最低的，因为当许多作业时，我
python - 查找多个 .npz 文件的最大形状
我有许多形状可能有所不同的 .npz 文件，我想找到哪个文件的形状最大。 npz 中有 2 个数组，我正在寻找第二个数组中最大的一个。以下代码片段有效，但返回形状所需的时间比我预期的要长。这是实现这一
python - 如何更改 .npz 文件中的值？
我想更改 npz 文件中的一个值。 npz 文件包含多个 npy，我希望除了一个('run_param')之外的所有文件都保持不变，我想保存在原始文件上。这是我的工作代码: DATA_DIR = '
python - Numpy *.npz 内部文件结构
谁能分享一些关于 *.npz 内部数据组织的信息？一些文档等。只是找不到任何东西.. 最佳答案文档如下: Format of .npz files , 指的是 Format of .npy file
numpy的文件存储.npy .npz 文件详解
Numpy能够读写磁盘上的文本数据或二进制数据。将数组以二进制格式保存到磁盘 np.load和np.save是读写磁盘数组数据的两个主要函数，默认情况下，数组是以未压缩的原始二进制格式保存在扩
python - IPython:如何自动加载 npz 文件并为变量赋值？
我是 Python 的新手，我急切地从 MATLAB 迁移到 IPython 作为我在实验室进行数据分析的首选语言。在 MATLAB 中，经过一段时间的数据处理后，我会做 >>> save('myr
python - 在全局命名空间中加载 Numpy npz 文件的内容
Numpy 允许在单个 npz 文件中导出多个数组，然后可以使用以下方法加载该文件: infile = "somefile.npz" inData = np.load( infile) print(
python - 从 HTTP 链接加载 .npz
我使用 Web 服务通过 AWS 上的 Jupyter Notebook 来训练我的一些深度学习模型。出于成本原因，我希望将数据作为 .npz 文件存储在我自己的服务器上，并将它们直接加载到我的远程计
python - numpy package .npz 组件文件
如何在不删除之前数据的情况下将数据写入.npz文件？我正在使用 python numpy 包，我在其中使用 savez() 来保存变量。但是，每次我将信息保存到文件时，它都会删除以前的信息。例如，
python - 如何将一组图像转换为单个 data_test.npz 文件？
我正在 build 一辆自动驾驶遥控汽车。我有 100 张从 pi 相机拍摄的图像，每一张都被命名为 Direction.jpg 。如何将这些图像转换为单个 .npz 文件，以便我可以训练神经网络。
python - 如何有效地将 tsv 文件中的数组列读取到每个列的单个 npz 文件中？
我有一个如下所示的数据文件: 58f0965a62d62099f5c0771d35dbc218 0.868632614612579 [0.028979932889342308
numpy - numpy 如何处理 npz 文件上的 mmap？
我有一个例子，我想使用 mmap 模式打开压缩的 numpy 文件，但似乎找不到任何有关它如何在幕后工作的文档。例如，它会在内存中解压存档然后进行 mmap 吗？它会即时解压吗？该配置缺少文档。最
python - 在 Python 中打开和查看 .npz 文件
我有一个未知的 .npz 文件，想看看里面有什么。我对 Python 很陌生。 >>> import numpy >>> b = numpy.load('data.npz') >>> print(b.
python - 将 numpy 数组序列化为 npz 字符串？
我正在寻找一种从多个不同类型的 numpy 数组中生成压缩二进制字符串的方法。 :D本题推荐的方法: Storing and loading numpy arrays as files 就是使用下面的
python - 使用 numpy.load 从文件加载压缩数据 (.npz)
我有一个数组: >>> data = np.ones((1,3,128)) 我使用 savez_compressed 将它保存到文件中: >>> with open('afile','w') as f
python - 如何在 python 中将 .npz 格式转换为 .csv？
我是Python新手。我想转换 .npz file (.npz 是 numpy 文件格式)转换为 .csv 文件以在 R 中使用它。请建议一种方法最佳答案尝试如下: import numpy as

首页

博学

6Ren·AI

商城

python - 替代 npz 文件？