初步解析Python下的多进程编程-6ren

初步解析Python下的多进程编程

转载作者：qq735679552 更新时间：2022-09-29 22:32:09

CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章初步解析Python下的多进程编程由作者收集整理，如果你对这篇文章有兴趣，记得点赞哟.

要让Python程序实现多进程（multiprocessing），我们先了解操作系统的相关知识.

Unix/Linux操作系统提供了一个fork()系统调用，它非常特殊。普通的函数调用，调用一次，返回一次，但是fork()调用一次，返回两次，因为操作系统自动把当前进程（称为父进程）复制了一份（称为子进程），然后，分别在父进程和子进程内返回.

子进程永远返回0，而父进程返回子进程的ID。这样做的理由是，一个父进程可以fork出很多子进程，所以，父进程要记下每个子进程的ID，而子进程只需要调用getppid()就可以拿到父进程的ID.

Python的os模块封装了常见的系统调用，其中就包括fork，可以在Python程序中轻松创建子进程:

 
    ? 
   
         # multiprocessing.py 
        
         import 
         os 
        
         print 
         'Process (%s) start...' 
         % 
         os.getpid() 
        
         pid  
         = 
         os.fork() 
        
         if 
         pid 
         = 
         = 
         0 
         : 
        
         print 
         'I am child process (%s) and my parent is %s.' 
         % 
         (os.getpid(), os.getppid()) 
        
         else 
         : 
        
         print 
         'I (%s) just created a child process (%s).' 
         % 
         (os.getpid(), pid)

运行结果如下:

 
    ? 
   
         Process ( 
         876 
         ) start... 
        
         I ( 
         876 
         ) just created a child process ( 
         877 
         ). 
        
         I am child process ( 
         877 
         )  
         and 
         my parent  
         is 
         876.

由于Windows没有fork调用，上面的代码在Windows上无法运行。由于Mac系统是基于BSD（Unix的一种）内核，所以，在Mac下运行是没有问题的，推荐大家用Mac学Python！。

有了fork调用，一个进程在接到新任务时就可以复制出一个子进程来处理新任务，常见的Apache服务器就是由父进程监听端口，每当有新的http请求时，就fork出子进程来处理新的http请求。 multiprocessing 。

如果你打算编写多进程的服务程序，Unix/Linux无疑是正确的选择。由于Windows没有fork调用，难道在Windows上无法用Python编写多进程的程序?

由于Python是跨平台的，自然也应该提供一个跨平台的多进程支持。multiprocessing模块就是跨平台版本的多进程模块.

multiprocessing模块提供了一个Process类来代表一个进程对象，下面的例子演示了启动一个子进程并等待其结束:

 
    ? 
   
         from 
         multiprocessing  
         import 
         Process 
        
         import 
         os 
        
         # 子进程要执行的代码 
        
         def 
         run_proc(name): 
        
         print 
         'Run child process %s (%s)...' 
         % 
         (name, os.getpid()) 
        
         if 
         __name__ 
         = 
         = 
         '__main__' 
         : 
        
         print 
         'Parent process %s.' 
         % 
         os.getpid() 
        
         p  
         = 
         Process(target 
         = 
         run_proc, args 
         = 
         ( 
         'test' 
         ,)) 
        
         print 
         'Process will start.' 
        
         p.start() 
        
         p.join() 
        
         print 
         'Process end.'

执行结果如下:

 
    ? 
   
         Parent process  
         928. 
        
         Process will start. 
        
         Run child process test ( 
         929 
         )... 
        
         Process end.

创建子进程时，只需要传入一个执行函数和函数的参数，创建一个Process实例，用start()方法启动，这样创建进程比fork()还要简单.

join()方法可以等待子进程结束后再继续往下运行，通常用于进程间的同步。 Pool 。

如果要启动大量的子进程，可以用进程池的方式批量创建子进程:

 
    ? 
   
         from 
         multiprocessing  
         import 
         Pool 
        
         import 
         os, time, random 
        
         def 
         long_time_task(name): 
        
         print 
         'Run task %s (%s)...' 
         % 
         (name, os.getpid()) 
        
         start  
         = 
         time.time() 
        
         time.sleep(random.random()  
         * 
         3 
         ) 
        
         end  
         = 
         time.time() 
        
         print 
         'Task %s runs %0.2f seconds.' 
         % 
         (name, (end  
         - 
         start)) 
        
         if 
         __name__ 
         = 
         = 
         '__main__' 
         : 
        
         print 
         'Parent process %s.' 
         % 
         os.getpid() 
        
         p  
         = 
         Pool() 
        
         for 
         i  
         in 
         range 
         ( 
         5 
         ): 
        
         p.apply_async(long_time_task, args 
         = 
         (i,)) 
        
         print 
         'Waiting for all subprocesses done...' 
        
         p.close() 
        
         p.join() 
        
         print 
         'All subprocesses done.'

执行结果如下:

 
    ? 
   
 
     
       
       
         Parent process  
         669. 
        
 
         Waiting  
         for 
         all 
         subprocesses done... 
        
 
         Run task  
         0 
         ( 
         671 
         )... 
        
 
         Run task  
         1 
         ( 
         672 
         )... 
        
 
         Run task  
         2 
         ( 
         673 
         )... 
        
 
         Run task  
         3 
         ( 
         674 
         )... 
        
 
         Task  
         2 
         runs  
         0.14 
         seconds. 
        
 
         Run task  
         4 
         ( 
         673 
         )... 
        
 
         Task  
         1 
         runs  
         0.27 
         seconds. 
        
 
         Task  
         3 
         runs  
         0.86 
         seconds. 
        
 
         Task  
         0 
         runs  
         1.41 
         seconds. 
        
 
         Task  
         4 
         runs  
         1.91 
         seconds. 
        
 
         All 
         subprocesses done. 
        
 
     
 
   

代码解读:

对Pool对象调用join()方法会等待所有子进程执行完毕，调用join()之前必须先调用close()，调用close()之后就不能继续添加新的Process了.

请注意输出的结果，task 0，1，2，3是立刻执行的，而task 4要等待前面某个task完成后才执行，这是因为Pool的默认大小在我的电脑上是4，因此，最多同时执行4个进程。这是Pool有意设计的限制，并不是操作系统的限制。如果改成:

就可以同时跑5个进程.

由于Pool的默认大小是CPU的核数，如果你不幸拥有8核CPU，你要提交至少9个子进程才能看到上面的等待效果。进程间通信。

Process之间肯定是需要通信的，操作系统提供了很多机制来实现进程间的通信。Python的multiprocessing模块包装了底层的机制，提供了Queue、Pipes等多种方式来交换数据.

我们以Queue为例，在父进程中创建两个子进程，一个往Queue里写数据，一个从Queue里读数据:

 
    ? 
   
         from 
         multiprocessing  
         import 
         Process, Queue 
        
         import 
         os, time, random 
        
         # 写数据进程执行的代码: 
        
         def 
         write(q): 
        
         for 
         value  
         in 
         [ 
         'A' 
         ,  
         'B' 
         ,  
         'C' 
         ]: 
        
         print 
         'Put %s to queue...' 
         % 
         value 
        
         q.put(value) 
        
         time.sleep(random.random()) 
        
         # 读数据进程执行的代码: 
        
         def 
         read(q): 
        
         while 
         True 
         : 
        
         value  
         = 
         q.get( 
         True 
         ) 
        
         print 
         'Get %s from queue.' 
         % 
         value 
        
         if 
         __name__ 
         = 
         = 
         '__main__' 
         : 
        
         # 父进程创建Queue，并传给各个子进程： 
        
         q  
         = 
         Queue() 
        
         pw  
         = 
         Process(target 
         = 
         write, args 
         = 
         (q,)) 
        
         pr  
         = 
         Process(target 
         = 
         read, args 
         = 
         (q,)) 
        
         # 启动子进程pw，写入: 
        
         pw.start() 
        
         # 启动子进程pr，读取: 
        
         pr.start() 
        
         # 等待pw结束: 
        
         pw.join() 
        
         # pr进程里是死循环，无法等待其结束，只能强行终止: 
        
         pr.terminate()

运行结果如下:

 
    ? 
   
         Put A to queue... 
        
         Get A  
         from 
         queue. 
        
         Put B to queue... 
        
         Get B  
         from 
         queue. 
        
         Put C to queue... 
        
         Get C  
         from 
         queue.

在Unix/Linux下，multiprocessing模块封装了fork()调用，使我们不需要关注fork()的细节。由于Windows没有fork调用，因此，multiprocessing需要“模拟”出fork的效果，父进程所有Python对象都必须通过pickle序列化再传到子进程去，所有，如果multiprocessing在Windows下调用失败了，要先考虑是不是pickle失败了。小结。

在Unix/Linux下，可以使用fork()调用实现多进程.

要实现跨平台的多进程，可以使用multiprocessing模块.

进程间通信是通过Queue、Pipes等实现的.

最后此篇关于初步解析Python下的多进程编程的文章就讲到这里了,如果你想了解更多关于初步解析Python下的多进程编程的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

文章推荐：全民k歌女网名霸气女神范2020 好听超有范的女生全民k歌网名

文章推荐：快手个性网名女生伤感唯美2020 女生伤感个性网名快手专用

文章推荐：抖音个性网名女生名字唯美伤感适合女生的抖音个性网名大全

linux - 如何通过 STIME 终止 linux 进程(悬空 svnserve 进程)
我是 Linux 的新手，并且继承了保持我们的单一 Linux 服务器运行的职责。这是我们的SVN服务器，所以比较重要。原来在我之前维护它的人有一个 cron 任务，当有太多 svnserve 进程
Nodejs极简入门教程（三）：进程
Node 虽然自身存在多个线程，但是运行在 v8 上的 JavaScript 是单线程的。Node 的 child_process 模块用于创建子进程，我们可以通过子进程充分利用 CPU。范例：
ubuntu - Jenkins 进程
Jenkins 有这么多进程处于事件状态是否正常？我检查了我的设置，我只配置了 2 个“执行者”... htop http://d.pr/i/RZzG+ 最佳答案您不仅要限制 Master 中的执
带管道的 Scala 进程
我正在尝试在 scala 中运行这样的 bash 命令: cat "example file.txt" | grep abc Scala 有一个特殊的流程管道语法，所以这是我的第一个方法: val f
循环和文件输出中的 Java 进程
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 1
multithreading - 进程、线程和并发编程
我需要一些帮助来理解并发编程的基础知识。事实上，我读得越多，就越感到困惑。因此，我理解进程是顺序执行的程序的一个实例，并且它可以由一个或多个线程组成。在单核CPU中，一次只能执行一个线程，而在多核CP
testing - 在集成测试期间如何运行服务器(进程)？
我的问题是在上一次集成测试后服务器进程没有关闭。在integration.rs中，我有: lazy_static! { static ref SERVER: Arc> = {
Scala 进程 - 捕获标准输出和退出代码
我正在使用 Scala scala.sys.process图书馆。我知道我可以用 ! 捕获退出代码和输出 !!但是如果我想同时捕获两者呢？我看过这个答案 https://stackoverflow
c++ - 使用共享库同步两个C++进程
我正在开发一个C++类(MyClass.cpp)，将其编译为动态共享库(MyClass.so)。同一台Linux计算机上运行的两个不同应用程序将使用此共享库。它们是两个不同的应用程序。它不是多线程
c - 查找UDP数据包的源IP/进程
我在我的 C 程序中使用 recvfrom() 从多个客户端接收 UDP 数据包，这些客户端可以使用自定义用户名登录。一旦他们登录，我希望他们的用户名与唯一的客户端进程配对，这样服务器就可以通过数据包
C、进程、fork
如何更改程序，以便函数 function_delayed_1 和 function_delayed_2 仅同时执行一次: int main(int argc, char *argv[]) {
c - 操作系统 - 进程
考虑这两个程序: //in #define MAX 50 int main(int argc, char* argv[]) { int *count; int fd=shm
linux - 如何同时打开三个终端(进程)
请告诉我如何一次打开三个终端，这样我的项目就可以轻松执行，而不必打开三个终端三次然后运行三个exe文件。请问我们如何通过脚本来做到这一点，即打开三个终端并执行三个 exe 文件。最佳答案在后台运行
远程计算机上的 C# 进程
我编写了一个监控服务来跟踪一组进程，并在服务行为异常、内存使用率高、超出 CPU 运行时间等时发出通知。这在我的本地计算机上运行良好，但我需要它指向远程机器并获取这些机器上的进程信息。我的方法，在
c# - 进程、线程和线程池
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。想改进这个问题？将问题更新为 on-topic对于堆栈溢出。 8年前关闭。 Improve this qu
c# - 后台线程/进程
我有一个允许用户上传文件的应用程序。上传完成后，必须在服务器上完成许多处理步骤(解压、存储、验证等...)，因此稍后会在一切完成后通过电子邮件通知用户。我见过很多示例，其中 System.Compo
linux - 什么时候将虚拟地址分配给程序/进程？
这个问题对很多人来说可能听起来很愚蠢，但我想对这个话题有一个清晰的理解。例如:当我们在 linux(ubuntu, x86) 上构建一个 C 程序时，它会在成功编译和链接过程后生成 a.out。 a.
java - 在linux中如何识别一个进程是java还是c或c++进程？
ps -eaf | grep java 命令在这里不是识别进程是否是 java 进程的解决方案，因为执行此命令后我的许多 java 进程未在输出中列出。最佳答案简答(希望有人写一个更全面的): 获
内核与系统中的 Windows 进程
我有几个与内核态和用户态的 Windows 进程相关的问题。如果我有一个 hello world 应用程序和一个暴露新系统调用 foo() 的 hello world 驱动程序，我很好奇在内核模式下
具有不受信任完整性级别的 Windows 进程
我找不到很多关于 Windows 中不受信任的完整性级别的信息，对此有一些疑问: 是否有不受信任的完整性级别进程可以创建命名对象的地方？ (互斥锁、事件等) 不受信任的完整性级别进程是否应该能够打开一

qq735679552

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

初步解析Python下的多进程编程