python - 使用 multiprocessing.Queue 时出现 Errno 32 Broken pipe 错误-6ren

python - 使用 multiprocessing.Queue 时出现 Errno 32 Broken pipe 错误

转载作者：太空宇宙更新时间：2023-11-04 04:36:30

50

4

我正在尝试抓取一些网页，鉴于每个网页大约需要 2 秒，而我有 20k 个网页，我决定使用 multiprocessing 库创建多个进程来同时抓取网页。

我的设置是一个 pandas 数据框，其中包含以前解析的数据和一个“新数据”字典。因为我不知道我是否需要抓取网页或者它是否已经被抓取，所以我创建了一个 multiprocessing.Queue 实例，以及一个 multiprocessing.Manager.dict() .我有一个函数 queueFill，它验证数据是否在数据帧中，如果不在，则将有问题的链接放在 multiprocessing.Queue 实例中。还有一个函数可以从 multiprocessing.Queue 中获取项目，getData，它从队列中获取一个链接，下载并解析它并将其添加到“新数据”字典中。

我正在尝试创建一个执行 queueFill 函数和一个执行 getData 函数的进程:

manager = multiprocessing.Manager() newPlayersDict = manager.dict() errorsDict = manager.dict() i=0 linklen = str(len(linklist)) q = multiprocessing.Queue() if 'playersDF' in globals(): p1 = multiprocessing.Process(target=queueFill,args=(playersDF,q,linklist)) else: p1 = multiprocessing.Process(target=queueFill,args=(None,q,linklist)) p2 = multiprocessing.Process(target=getData,args=(q,newPlayersDict,errorsDict,linklen,i)) time.sleep(0.5) p1.start() p2.start() p1.join() p2.join()
但是，运行它会给我一个 [Errno 32] Broken pipe 在线:

p1.start()
我不明白为什么会这样。即使将queueFill函数修改为立即返回，还是会报错。谁能帮助我理解为什么会发生此错误，以及我应该如何解决它？

最佳答案

回答我自己的问题，让 future 的人保持理智:

事实证明，多处理并不真正喜欢在 IPython/Jupyter 笔记本中运行。使用 __name__ 检查将代码移动到单独的独立脚本后，输出符合预期。

关于python - 使用 multiprocessing.Queue 时出现 Errno 32 Broken pipe 错误，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51578894/

50

4

0

文章推荐： css - 随着内容的移动移动背景

文章推荐： python - 使用多维键 pandas 错误进行索引

文章推荐： python - Scipy优化错误

pipe - gnuplot : plot pipe output
我有管道输出 command_a | command_b | ... | command_n 输出是一个数字序列 4.2 -1 ... 0.2 我可以使用 gnuplot 绘制这些数字吗？ (将 gn
python - 套接字类比 : a pipe or two pipes?
关闭。这个问题是opinion-based 。目前不接受答案。想要改进这个问题吗？更新问题，以便 editing this post 可以用事实和引文来回答它。 . 已关闭 6 年前。 Improv
pipe - 在 C++ 中使用 pipe() 管道管道
我目前正在尝试连接父项和子项之间的管道。子级正在执行 sort 并对从父级接收到的输入进行排序。然后 children 写入一个单独的管道。每个进程有两个管道。一个这样 parent 可以将输入发送给
Python os.pipe 与 multiprocessing.Pipe
最近我正在研究 Python 中的并行编程工具。这是 os.pipe 和 multiprocessing.Pipe 之间的两个主要区别。(尽管它们被使用的场合) os.pipe是单向，multipro
yahoo-pipes - 在 Yahoo Pipes 中，如何删除一个字段？
我的站点上运行着 Yahoo Pipe，Romneyomics它使用来自 Delicious 和 Topsy 的饲料。Delicious 提要不提供“描述”字段，但 Topsy 提供，并且不仅仅是一个
haskell - 如何使 Pipe 与 Haskell 的 Pipe 库并发？
我有一些使用管道的 Haskell 代码: module Main(main) where import Pipes a :: Producer Int IO () a = each [1..10]
python - stdout=subprocess.PIPE 和 stdout=PIPE 之间的区别
所以标题几乎解释了我的问题。 stdout=subprocess.PIPE 和 stdout=PIPE 有什么区别？两者都来自 subprocess 模块，但为什么要使用一个而不是另一个呢？你如何使用
unit-testing - Angular 2 单元测试 : Custom Pipe error The pipe could not be found
我有一个名为“myPipe”的自定义管道。我得到: The pipe 'myPipe' could not be found error 在我的单元测试中请建议在我的 .spec.ts 中导入和声明什
python - IOError : [Errno 32] Broken pipe when piping: `prog.py | othercmd`
我有一个非常简单的 Python 3 脚本: f1 = open('a.txt', 'r') print(f1.readlines()) f2 = open('b.txt', 'r') print(f
python - 为什么 pipe.close() 在 python 多处理中的 pipe.recv() 期间不会导致 EOFError？
我正在使用管道和 Python 的多处理模块在进程之间发送简单的对象。文档指出，如果管道已关闭，则调用 pipe.recv() 应该引发 EOFError。相反，我的程序只是阻塞在 recv() 上，
linux - pipe open '|' 和 '|-' 的区别(safe pipe open)
我在 perl 中见过这两种形式的管道 open。一种是简单的管道打开 open FH,'| command'; 其他是安全管道打开 open FH,'|-','command'; 现在，第二个中的
angular - 对话框测试 - 当我模拟 this.store$.pipe( select(...) ...).subscribe(..) 时，Jasmine 返回 this.store$.pipe 不是函数
我正在尝试对我的组件进行单元测试，但它立即生成一个错误: 类型错误:this.store$.pipe 不是函数根据我的理解， createSpyObj 应该模拟状态。我有不同的选项选项，但没有一个起
python - 从 python subprocess.Popen(command, stderr=subprocess.PIPE, stdout=subprocess.PIPE) 捕获 stderr
我在这里看到这个帖子很多次了；但未能从命令中捕获故意错误。迄今为止我找到的最好的部分工作.. from Tkinter import * import os import Image, ImageTk
pipe - 如何在管道命令行中使用第一个程序的返回码
我正在编写一个简单的程序来解析编译器的输出并重新格式化任何错误消息，以便我们使用的 IDE(visual studio)可以解析它们。我们使用 nmake构建，它将使用如下命令行调用编译器: cc16
pipe - 如何将stdin管道传送到Kubernetes中的容器中的容器中？
我有一个在coreos上运行的kubernetes集群。我希望在称为记录的Pod中的容器中运行journal2gelf https://github.com/systemd/journal2gelf。
pipe - 为什么管道中存在不对称行为
为什么当管道中没有写入器时，读取器存在可以，但当管道中没有读取器时，写入器存在就不行？。是不是因为reader需要等待，所以没有writer也没关系，而writer已经准备好数据了，即使数据准备好了
pipe - 重定向后缀命令管道的输出
我在/etc/postfix/master.cf 中创建了一个 postfix 命令管道，其中包含一个在 STDOUT 和 STDERR 上产生输出的有效命令。在终端上调用时一切正常(因此在 STDO
pipe - 如何通过管道传输字符串以处理'STDIN？
我有一个命令需要来自管道的输入。例如，考虑著名的 cat 命令: $ echo Hello | cat Hello 假设我在 Perl 6 程序中有一个字符串，我想将其通过管道传递给命令: use v
RXJS Pipe - 您能否将一个可观察结果附加到另一个可观察结果并获得两个结果？
因此，由于我们拥有各种设置，我习惯于遇到需要将一个可观察结果添加到另一个结果的地方，然后同时使用两者。我需要第一个在另一个之前完成的地方 getUser() .pipe( mergeMap
Angular Pipe 不适用于子路线
我在 Angular 5 中有一个非常简单的管道 import { Pipe, Injectable } from '@angular/core'; @Pipe({ name: "defaul

首页

博学

6Ren·AI

商城

python - 使用 multiprocessing.Queue 时出现 Errno 32 Broken pipe 错误