python - 减少 multiprocessing.Pool.starmap() 列表的内存大小-6ren

python - 减少 multiprocessing.Pool.starmap() 列表的内存大小

转载作者：太空狗更新时间：2023-10-30 02:51:03

27

4

所以我创建了一个多处理列表(特别是 multiprocessing.Pool().starmap())并希望减少其内存大小。名单如下:

import sys
import numpy as np
from itertools import product

lst1 = np.arange(1000)
lst3 = np.arange(0.05, 4, 0.05)

lst1_1 = list(product(enumerate(lst3),
                      (item for item in product(lst1, lst1) if item[0] < item[1])
                      ))

根据sys.getsizeof(lst1_1)计算出的内存大小是317840928

看到lst1的类型是int32，我想把lst的dtype改成int16可以减少的内存大小>lst1，因此 ls1_1 减半，因为 int16 占用了一半的内存作为 int32 数据，所以我做了以下:

lst2 = np.arange(1000, dtype = np.int16)
lst2_1 = list(product(enumerate(lst3),
                      (item for item in product(lst2, lst2) if item[0] < item[1])
                      ))

令人惊讶的是，sys.getsizeof(lst2_1)计算出的lst2_1的内存大小仍然是317840928。

我的问题如下:

1)列表的内存大小是否与源数据的数据类型无关？

2) 如果是这样，那么在不转换为生成器的情况下减少列表内存大小的最佳方法是什么？

请注意，转换为生成器无济于事的原因是，即使它被转换为生成器，当它被扔进 multiprocessing.Pool().starmap() 时，它无论如何都会转换回列表。

最佳答案

在检查这些数组的大小之前，您正在将数组转换为 Python List。里面的整数被转换为 Python 对象。当你这样做时，它会导致更大的尺寸。这是您的代码的示例行为。

import sys
import numpy as np

lst1 = np.arange(1000)
lst2 = np.arange(1000, dtype = np.int16)

print(sys.getsizeof(lst1)) # 4096
print(sys.getsizeof(lst2)) # 2096
print(sys.getsizeof(list(lst1))) # 9112
print(sys.getsizeof(list(lst2))) # 9112

Numpy 是一个基于 C 的库，因此您可以选择要使用的整数类型(就像 int、long、long long)。您需要将数据保留为 C 类型，以便保留这些优势。这就是为什么 Numpy 本身有这么多功能，将操作和数据保持在较低级别。

关于python - 减少 multiprocessing.Pool.starmap() 列表的内存大小，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57155186/

27

4

0

文章推荐： python - 检测和隔离绿色网球 table 板上的线条

文章推荐： python - 如何根据数据框中的条件将行与上一行合并

文章推荐： python - 如何打印可被 3 和 5 整除的 0 到 100 之间的数字？

文章推荐： python - 有没有办法直接从枚举实例化一个类？

Python - 具有两个参数的多处理 StarMap
我有一个可以并行运行多个查询的函数，但是我在使用 multiprocessing 运行我的函数时遇到了一些麻烦。我有这段代码: def run(args): query, cursor = a
python - Starmap 在传入参数之前修改参数？
我在尝试使用 multiprocessing.Pool.starmap 时遇到了一个奇怪的错误。重现错误所需的最少代码在这里: from multiprocessing import Pool # I
python - 如何将两个参数传递给 Pool.starmap()？
最初，对于我使用的代码，Pool.map 足以对我的代码进行线程化，因为只有一个参数(一个可迭代的)作为参数传入我的函数。现在，我需要将多个参数传递给该函数，但我在使用 Pool.starmap 时遇
带有字典列表的 Python pool.starmap？
是否有类似于 pools.starmap 的函数可以与字典列表一起使用？代替 :pools.starmap(func, iterable_of_tuple) 你将会拥有:pools.starmapd
python 多处理池.starmap 不起作用
我正在使用多处理pool.starmap函数。我发现一个奇怪的问题。 from multiprocessing import Pool p = multiprocessing.Pool() NODE
python - 在多处理 pool.starmap 中传递字符串列表时出错
我正在尝试一些网页抓取。我正在将包含 URL 的列表传递给 pool.starmap ，但我遇到了参数错误。显示我的代码的简化版本: 有人可以帮我解决这个问题吗？对不起，如果我做了一些愚蠢的事情。 f
Pool/starmap 的 Python 多处理行为
我有一个使用多处理库来计算一些东西的程序。大约有 10K 个输入需要计算，每个输入需要 0.2 秒到 10 秒的时间。我当前的方法使用池: # Inputs signals = [list(s) f
Python 多处理 - starmap_async 在 starmap 工作的地方不起作用？
这个starmap示例程序按预期工作: import multiprocessing def main(): pool = multiprocessing.Pool(10) param
python multiprocessing starmap vs apply_async，哪个更快？
假设我有这两种方法来完成相同的任务: from multiprocessing import Pool pool = Pool(4) def func(*args): # do some sl
python - 如何在 pandas 数据帧上使用 pool.starmap()？
关于 this post 的第二个答案, 我试过下面的代码 from multiprocessing import Pool import numpy as np from itertools imp
python - 减少 multiprocessing.Pool.starmap() 列表的内存大小
所以我创建了一个多处理列表(特别是 multiprocessing.Pool().starmap())并希望减少其内存大小。名单如下: import sys import numpy as np fr
python - 什么时候 starmap 比 `List Comprehension` 更受欢迎
在回答问题时Clunky calculation of differences between an incrementing set of numbers, is there a more beau
python - 在 Python 中使用 Pool 时将 kwargs 传递给 starmap
我正在使用 Pool 对我的程序进行多线程处理，使用 starmap 来传递参数。我被卡住了，因为我似乎无法找到一种方法来传递 kwargs 以及我在 starmap 函数中传递的 zip 数组。

首页

博学

6Ren·AI

商城

python - 减少 multiprocessing.Pool.starmap() 列表的内存大小