- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有 2 个简单的函数(在一个范围内循环)可以单独运行而没有任何依赖性。我正在尝试使用 Python 多处理模块和多线程模块来运行这 2 个函数。
当我比较输出时,我看到多进程应用程序比多线程模块多花费 1 秒。
我读到由于全局解释器锁,多线程效率不高......
基于以上说法-
1. 如果两个进程之间没有依赖关系,最好使用多处理吗?
2. 如何计算我可以在我的机器上运行的进程/线程数以实现最大效率..
3.还有,有没有办法通过使用多线程来计算程序的效率...
多线程模块...
from multiprocessing import Process
import thread
import platform
import os
import time
import threading
class Thread1(threading.Thread):
def __init__(self,threadindicator):
threading.Thread.__init__(self)
self.threadind = threadindicator
def run(self):
starttime = time.time()
if self.threadind == 'A':
process1()
else:
process2()
endtime = time.time()
print 'Thread 1 complete : Time Taken = ', endtime - starttime
def process1():
starttime = time.time()
for i in range(100000):
for j in range(10000):
pass
endtime = time.time()
def process2():
for i in range(1000):
for j in range(1000):
pass
def main():
print 'Main Thread'
starttime = time.time()
thread1 = Thread1('A')
thread2 = Thread1('B')
thread1.start()
thread2.start()
threads = []
threads.append(thread1)
threads.append(thread2)
for t in threads:
t.join()
endtime = time.time()
print 'Main Thread Complete , Total Time Taken = ', endtime - starttime
if __name__ == '__main__':
main()
多进程模块
from multiprocessing import Process
import platform
import os
import time
def process1():
# print 'process_1 processor =',platform.processor()
starttime = time.time()
for i in range(100000):
for j in range(10000):
pass
endtime = time.time()
print 'Process 1 complete : Time Taken = ', endtime - starttime
def process2():
# print 'process_2 processor =',platform.processor()
starttime = time.time()
for i in range(1000):
for j in range(1000):
pass
endtime = time.time()
print 'Process 2 complete : Time Taken = ', endtime - starttime
def main():
print 'Main Process start'
starttime = time.time()
processlist = []
p1 = Process(target=process1)
p1.start()
processlist.append(p1)
p2 = Process(target = process2)
p2.start()
processlist.append(p2)
for i in processlist:
i.join()
endtime = time.time()
print 'Main Process Complete - Total time taken = ', endtime - starttime
if __name__ == '__main__':
main()
最佳答案
如果你的机器上有两个可用的 CPU,你有两个不需要通信的进程,你想同时使用它们来使你的程序更快,你应该使用多处理模块,而不是线程模块。
全局解释器锁 (GIL) 阻止 Python 解释器通过使用多个线程来有效地使用多个 CPU,因为一次只有一个线程可以执行 Python 字节码。因此,多线程不会改善应用程序的整体运行时间,除非您有阻塞调用(例如等待 IO)或释放 GIL(例如 numpy
会为一些昂贵的调用执行此操作)延长的时间。然而,多处理库创建了单独的子进程,因此解释器的多个副本,因此它可以有效地利用多个 CPU。
但是,在您提供的示例中,您有一个进程完成得非常快(在我的机器上不到 0.1 秒),而一个进程在另一个进程上大约需要 18 秒才能完成。确切的数字可能因您的硬件而异。在那种情况下,几乎所有的工作都发生在一个进程中,所以无论如何你实际上只使用了一个 CPU。在这种情况下,生成进程与线程的开销增加可能导致基于进程的版本变慢。
如果您让两个进程都执行 18 秒的嵌套循环,您应该会看到多处理代码运行得更快(假设您的机器实际上有多个 CPU)。在我的机器上,我看到多处理代码在大约 18.5 秒内完成,多线程代码在 71.5 秒内完成。我不确定为什么多线程花费的时间超过 36 秒,但我的猜测是 GIL 导致了某种线程争用问题,这会减慢两个线程的执行速度。
关于您的第二个问题,假设系统上没有其他负载,您应该使用与系统上的 CPU 数量相等的进程数。您可以通过在 Linux 系统上执行 lscpu
、在 Mac 系统上执行 sysctl hw.ncpu
或从运行对话框中运行 dxdiag
来发现这一点Windows(可能还有其他方法,但我总是这样做)。
对于第三个问题,计算额外进程的效率的最简单方法就是测量程序的总运行时间,使用 time.time()
作为你是,或者 Linux 中的 time
实用程序(例如 time python myprog.py
)。理想的加速应该等于您使用的进程数,因此在 4 个 CPU 上运行的 4 进程程序应该至多比具有 1 个进程的相同程序快 4 倍,假设您获得最大从额外的过程中受益。如果其他流程对您的帮助不大,那么它会不到 4 倍。
关于python - 多进程与多线程 Python 耗时,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19326582/
我在我的 UIPath 项目中实现了一个普通的“for each”循环(不是每行特定的 excel)。 for-each 循环使用以前从 excel 文件中检索到的数据查看数据表。 然后,for-ea
我认为我的 SQL 查询花费的时间太长,现在看起来大约需要 30 秒。我有两个表,Record 和 Mainrecord。我想获取有关列金额中包含 0 的所有 Mainrecords 的信息,并且在这
这个编辑器是水平的http://tinymce.moxiecode.com/examples/simple.php我似乎只找到水平编辑器,有人遇到过垂直编辑器吗?有什么例子吗? build 需要多长时
我想创建一个跟踪任务时间的 ASP.NET WinForms 应用程序。我需要能够编写表单,以便将任务添加到数据库、在新选项卡中打开它,以及能够开始、暂停和停止任务。完成后,我需要计算完成任务所需的时
抱歉,我是 C 的新手。但我做错了什么?几乎尝试了一切,但仍然无法计算执行 t1 和 t2 之间的代码所传递的秒数,总是返回我在 0.00 秒内完成。感谢您的耐心等待:) #include cloc
我有 2 个简单的函数(在一个范围内循环)可以单独运行而没有任何依赖性。我正在尝试使用 Python 多处理模块和多线程模块来运行这 2 个函数。 当我比较输出时,我看到多进程应用程序比多线程模块多花
尝试记录使用装饰器运行函数所需的时间,但我误解了一些东西。它拒绝写登录装饰器。 当你颠倒装饰器的顺序时,它会导致模板上的构建错误(就像信息丢失一样)。 在我的初始 py 中: if app.debug
我听说 System.out.println(); Java 语句是昂贵的(它消耗了很多时间) 所以我试着评估一下它的成本: 当我评估 5 个语句时...成本 = 1.0 所以我预计 1 条语句的成本
我正在使用 codeigniter REST-API(作者:philsturgeon 引用 URL: https://github.com/philsturgeon/codeigniter-rests
我在 SFML 中有一个时钟和计时器,它测量秒数。我试图在经过一定秒数(特别是 4 秒)后执行下一个操作 这是我的代码 #include "stdafx.h" #include "Splash
例如,我们在 SomeActivity 中,该 Activity 有一个按钮,用于调用将文件从一个目录移动到另一个目录(我们称之为作业)。 在黑莓手机上我会: 推送一个不可取消的弹出窗口(对话框屏幕)
我正在尝试从大小为 7,140,000 的 ArrayList 中删除 140,000 个对象。我预计这会花费几秒钟(如果那样的话),但 Java 每千个对象花费几秒钟。这是我的代码:
我得到了这个查询,它占用了我的 elapsed_time 并且工作正常,但后来我意识到我得到的 actual_elapsed 的值是错误的。 actual_elapsed 是我使用 TIMEDIFF(
我在更新面板中放置了一个 GridView。 当用户按下按钮时,gridView 将被一个数据表填满: GridView_Overview.Da
客户想要将数据库从 MS SQL 转换为 MySql。 就我个人而言,我不会这样做,我更喜欢使用 MS SQL 来处理大型数据库,并且喜欢使用 MSSQL 时可用的工具。 但是我确实在较小的项目上使用
我目前正在为一个 Julia 项目使用 Graph Database,使用 Redis。 有时 Redis 请求需要 300 毫秒才能执行,我不明白为什么。我运行了一个简单的请求 10.000 次(请
我们在一次运行中处理了 500 万个请求。然而,在运行期间,很少有请求失败。验证关闭后,我们了解到 Full GC 已启动,并且花费了超过 40 秒(到 60 秒),从而导致超时。 配置:我们有 3
我是一名优秀的程序员,十分优秀!