python - 为什么 "pickle"和 "multiprocessing picklability"在 Python 中如此不同？-6ren

python - 为什么 "pickle"和 "multiprocessing picklability"在 Python 中如此不同？

转载作者：太空宇宙更新时间：2023-11-04 04:07:53

33

4

在 Windows 上使用 Python 的 multiprocessing 需要许多参数在传递给子进程时是“可挑选的”。

import multiprocessing

class Foobar:

   def __getstate__(self):
       print("I'm being pickled!")

def worker(foobar):
   print(foobar)

if __name__ == "__main__":
    # Uncomment this on Linux
    # multiprocessing.set_start_method("spawn")

    foobar = Foobar()
    process = multiprocessing.Process(target=worker, args=(foobar, ))
    process.start()
    process.join()

文档 mentions this explicitly几次:

Picklability

Ensure that the arguments to the methods of proxies are picklable.

[...]

Better to inherit than pickle/unpickle

When using the spawn or forkserver start methods many types from multiprocessing need to be picklable so that child processes can use them. However, one should generally avoid sending shared objects to other processes using pipes or queues. Instead you should arrange the program so that a process which needs access to a shared resource created elsewhere can inherit it from an ancestor process.

[...]

More picklability

Ensure that all arguments to Process.__init__() are picklable. Also, if you subclass Process then make sure that instances will be picklable when the Process.start method is called.

但是，我注意到“multiprocessing pickle”和标准 pickle 模块之间有两个主要区别，我很难理解所有这些。

`multiprocessing.Queue()` 不是“可挑选的”但可传递给子进程

import pickle
from multiprocessing import Queue, Process

def worker(queue):
    pass

if __name__ == "__main__":
    queue = Queue()

    # RuntimeError: Queue objects should only be shared between processes through inheritance
    pickle.dumps(queue)

    # Works fine
    process = Process(target=worker, args=(queue, ))
    process.start()
    process.join()

如果在“main”中定义则不可 pickle

import pickle
from multiprocessing import Process

def worker(foo):
    pass

if __name__ == "__main__":
    class Foo:
        pass

    foo = Foo()

    # Works fine
    pickle.dumps(foo)

    # AttributeError: Can't get attribute 'Foo' on <module '__mp_main__' from 'C:\\Users\\Delgan\\test.py'>
    process = Process(target=worker, args=(foo, ))
    process.start()
    process.join()

如果 multiprocessing 内部不使用 pickle，那么这两种序列化对象的方式有什么内在区别？

此外，“继承”在多处理上下文中是什么意思？我怎么会更喜欢它而不是 pickle 呢？

最佳答案

当multiprocessing.Queue 被传递给子进程时，实际发送的是从pipe 获得的文件描述符(或句柄)。，它必须在创建子项之前由父项创建。 pickle 的错误是为了防止尝试通过另一个 Queue(或类似 channel )发送 Queue，因为那时使用它为时已晚. (Unix 系统实际上支持通过某些类型的套接字发送管道，但 multiprocessing 不使用此类功能。)预计某些 multiprocessing 类型是“显而易见的”可以发送到否则无用的子进程，因此没有提及明显的矛盾。

由于“spawn”启动方法无法使用任何已创建的 Python 对象创建新进程，它必须重新导入主脚本以获得相关函数/类定义。由于显而易见的原因，它没有像原始运行那样设置 __name__，因此依赖于该设置的任何内容都将不可用。 (在这里，失败的是 unpickling，这就是您的手动 pickling 起作用的原因。)

fork 方法在父对象(仅在 fork 时)仍然存在的情况下启动子对象；这就是继承的含义。

关于python - 为什么 "pickle"和 "multiprocessing picklability"在 Python 中如此不同？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56912846/

33

4

0

文章推荐： linux - 如何将Intellij IDEA从源代码编译为执行文件

文章推荐： python - 如果缺少一件元素，则 Scrapy 不会抓取

文章推荐： linux - 将文本和命令键写入 Linux 上的 TTY

python - 如果 pickle 父类和子类实例，如何在类层次结构中最好地 pickle/取消 pickle
假设我有一个 A 类和一个派生自 A 的 B 类。我想 pickle/unpickle B 类的一个实例。A 和 B 都定义了 __getstate__/__setstate__ 方法(假设 A
pickle - Graphite pickle 与线路接收器
似乎有两种方法可以将指标推向 Graphite /碳，线路接收器 pickle 接收器根据文档 http://graphite.readthedocs.org/en/1.0/feeding-car
pickle - 如何解析Perforce “pickle”二进制输出？
Perforce命令行有一个特殊的开关-G，它使用python的“pickle”序列化格式可以使输出成为机器可读的。一般来说，实际上是这样吗？例如，考虑p4 -G diff -duw3 的输出。
python - pickle 的字节数据如何取消 pickle ？
如何从 BytesIO 对象写入和读回 pickled 数据？我尝试过: import io import cPickle as pickle s1 = "foo" bytes_io = io.By
python - 多重处理:池和 pickle 错误 - Pickling 错误:无法 pickle :属性查找 __builtin__.instancemethod 失败
我有两个文件: x.py class BF(object) def __init__(): . . def add(self,z): . . y.py from y
python - pickle:它如何 pickle 一个函数？
在 post昨天发帖，无意中发现改了__qualname__函数对 pickle 有意想不到的影响.通过运行更多测试，我发现在对函数进行 pickle 时，pickle不像我想的那样工作，改变 __q
python - 如何在没有副作用的情况下 pickle 和解 pickle ？
为什么 pickle 重用现有的 Python 类“C”而不是从 pickle 字节重建类？有没有一种方法可以在没有副作用的情况下 pickle 和解 pickle ？这是我的回复 session
pickle - mpi4py 尝试发送类时出现 Pickling 错误
我使用 mpi4py 将一些计算拆分到多个过程中。基本上我只是计算一些凸包的体积，这是我使用 tvtk 和 mayavi 创建的。只有第一个过程导入这些库: ... if rank==0: f
python - pickle 不可 pickle 的对象
我正在用 pygame 制作一个绘图程序，我想在其中为用户提供一个选项来保存程序的确切状态，然后在稍后重新加载它。在这一点上，我保存了我的全局字典的副本，然后遍历， pickle 每个对象。 pyga
Python - 如何使这个不可 pickle 的对象可 pickle ？
所以，我有一个对象，里面有很多不可 pickle 的东西(pygame 事件、orderedDicts、时钟等)，我需要将它保存到磁盘。事情是，如果我可以让这个东西存储一个有进度的字符串(我只需要一
python - 如何 pickle 和去 pickle
import pickle variety = ["sweet", "box", "cat"] shape = ["back","spear", "log"] pickleFile = open("
memory - gensim: pickle 还是不 pickle ？
我有一个关于 gensim 的问题。我想知道在保存或加载模型(或多个模型)时是否建议或需要使用 pickle，因为我在 GitHub 上找到了可以使用的脚本。 mymodel = Doc2Vec(do
pickle - _pickle.UnpicklingError : pickle data was truncated
我正在使用 python3.6/。我使用 protocol=pickle.HIGHEST_PROTOCOL pickle 了我的文件当我按如下方式加载时: with open('data.sav',
python - 分段 pickle 对象与一次 pickle 对象之间的区别？
给定一个像这样的任意Pythonic对象: class ExampleObj(object): def __init__(self): self.a = 'a'
python - 如何避免 pickle 字典与 pickle 列表的惩罚
简介我有一本具有以下格式的字典: dict_list = {'S0':[[list of int],[list of int]], 'S1':[[list of int],[list of int]
python - pickle 错误 : Can't pickle
我想知道这个错误可能意味着什么: PicklingError: Can't pickle : attribute lookup __builtin__.function failed 我理解这与使用多
python - 为什么我未 pickle 的顺序与 pickle 时的顺序不同？
我对 python 变量持久性有点困惑，在我的代码中，我使用以下代码使模型参数在某些迭代期间持久化 with open('W_Hs_Hu_iter'+str(inx)+'.pickle', 'wb'
python - 如何使用自引用和带有插槽的类来 pickle 和取消 pickle 对象？
当对象通过其属性之一引用自身时，从带有插槽的类中挑选对象的正确方法是什么？这是一个简单的示例，使用我当前的实现，我不确定它是否 100% 正确: import weakref import pickl
python - pickle numpy 数组或列表时 pickle 文件大小
我有数千个长 (8640) 整数列表元组。例如: type(l1) tuple len(l1) 2 l1[0][:10] [0, 31, 23, 0, 0, 0, 0, 0, 0, 0] l1[1][
Python:用一些不可 pickle 的项目 pickle 字典
我有一个对象 gui_project，它有一个属性 .namespace，这是一个命名空间字典。 (即从字符串到对象的字典。) (这在类似 IDE 的程序中使用，让用户在 Python shell 中

首页

博学

6Ren·AI

商城