gpt4 book ai didi

python - 为什么这个 numpy 数组太大而无法加载?

转载 作者:太空狗 更新时间:2023-10-29 17:51:02 53 4
gpt4 key购买 nike

我有一个 3.374Gb 的 npz 文件,myfile.npz

我可以读入它并查看文件名:

a = np.load('myfile.npz')
a.files

给予

['arr_1','arr_0']

我可以读入 'arr_1' ok

a1=a['arr_1']

但是,我无法加载 arr_0,也无法读取它的形状:

a1=a['arr_0']
a['arr_0'].shape

以上两种操作都出现以下错误:

ValueError: array is too big

我有 16Gb RAM,其中 8.370Gb 可用。所以问题似乎与内存无关。我的问题是:

  1. 我应该能够读入这个文件吗?

  2. 谁能解释这个错误?

  3. 我一直在考虑使用 np.memmap 来解决这个问题 - 这是一种合理的方法吗?

  4. 我应该使用什么调试方法?

编辑:

我可以访问具有更多 RAM (48GB) 的计算机并加载它。 dtype 实际上是 complex128a['arr_0'] 的未压缩内存是 5750784000 字节。似乎可能需要 RAM 开销。那个或我预测的可用 RAM 量是错误的(我使用了 Windows sysinternals RAMmap)。

最佳答案

尺寸为 (200, 1440, 3, 13, 32)np.complex128 数组在未压缩的情况下应该占用大约 5.35GiB,所以如果您确实有8.3GB 的空闲、可寻址内存,那么原则上您应该能够加载数组。

但是,根据您在下面评论中的回复,您使用的是 32 位版本的 Python 和 numpy。在 Windows 中,a 32 bit process can only address up to 2GB of memory (如果二进制文件是使用 IMAGE_FILE_LARGE_ADDRESS_AWARE 标志编译的,则为 4GB;大多数 32 位 Python 发行版不是)。因此,无论您拥有多少物理内存,您的 Python 进程都被限制为 2GB 的地址空间。

您可以安装 64 位版本的 Python、numpy 和您需要的任何其他 Python 库,或者忍受 2GB 的限制并尝试解决它。在后一种情况下,您可能会主要在磁盘上存储超过 2GB 限制的数组(例如使用 np.memmap),但我建议您选择选项 #1,因为操作在大多数情况下,内存映射数组比完全驻留在 RAM 中的普通 np.array 慢得多。


如果您已经有另一台机器有足够的 RAM 将整个数组加载到核心内存中,那么我建议您以不同的格式保存数组(作为普通的 np.memmap 二进制文件,或者更好的格式,在 HDF5 中使用 PyTablesH5py 的文件)。也可以(虽然有点棘手)从 .npz 文件中提取问题数组而不将其加载到 RAM 中,这样您就可以将其作为 np.memmap 打开驻留在磁盘上的数组:

import numpy as np

# some random sparse (compressible) data
x = np.random.RandomState(0).binomial(1, 0.25, (1000, 1000))

# save it as a compressed .npz file
np.savez_compressed('x_compressed.npz', x=x)

# now load it as a numpy.lib.npyio.NpzFile object
obj = np.load('x_compressed.npz')

# contains a list of the stored arrays in the format '<name>.npy'
namelist = obj.zip.namelist()

# extract 'x.npy' into the current directory
obj.zip.extract(namelist[0])

# now we can open the array as a memmap
x_memmap = np.load(namelist[0], mmap_mode='r+')

# check that x and x_memmap are identical
assert np.all(x == x_memmap[:])

关于python - 为什么这个 numpy 数组太大而无法加载?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28276244/

53 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com