- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在尝试在 python(在 ubuntu 上)下运行并行进程。
我开始使用 multiprocessing,对于简单的示例来说效果很好。
然后出现了 pickle 错误,所以我转向了 pathos。我对不同的选项感到有点困惑,因此编写了一个非常简单的基准测试代码。
import multiprocessing as mp
from pathos.multiprocessing import Pool as Pool1
from pathos.pools import ParallelPool as Pool2
from pathos.parallel import ParallelPool as Pool3
import time
def square(x):
# calculate the square of the value of x
return x*x
if __name__ == '__main__':
dataset = range(0,10000)
start_time = time.time()
for d in dataset:
square(d)
print('test with no cores: %s seconds' %(time.time() - start_time))
nCores = 3
print('number of cores used: %s' %(nCores))
start_time = time.time()
p = mp.Pool(nCores)
p.map(square, dataset)
# Close
p.close()
p.join()
print('test with multiprocessing: %s seconds' %(time.time() - start_time))
start_time = time.time()
p = Pool1(nCores)
p.map(square, dataset)
# Close
p.close()
p.join()
print('test with pathos multiprocessing: %s seconds' %(time.time() - start_time))
start_time = time.time()
p = Pool2(nCores)
p.map(square, dataset)
# Close
p.close()
p.join()
print('test with pathos pools: %s seconds' %(time.time() - start_time))
start_time = time.time()
p = Pool3()
p.ncpus = nCores
p.map(square, dataset)
# Close
p.close()
p.join()
print('test with pathos parallel: %s seconds' %(time.time() - start_time))
我知道了
- 0.001s 纯串行代码,无并行,
- 0.100s multiprocessing
选项,
- 0.100 秒,pathos.multiprocessing
,
- 4.470 秒,pathos.pools
,
- AssertionError
错误与 pathos.parallel
我从 http://trac.mystic.cacr.caltech.edu/project/pathos/browser/pathos/examples.html 复制了如何使用这些不同的选项
我知道对于这样一个简单的例子,并行处理比普通的串行代码要长。我不明白的是悲情的相对表现。
我检查了讨论,但无法理解为什么 pathos.pools
如此长,以及为什么我会收到错误(不确定最后一个选项的性能如何)。
我还尝试了一个简单的平方函数,为此即使 pathos.multiprocessing
也比 multiprocessing
谁能解释一下这些不同选项之间的区别?
此外,我在远程计算机上运行了 pathos.multiprocessing
选项,运行的是 centOS,性能比 multiprocessing
差了大约 10 倍 .
根据租用电脑的公司的说法,它应该像家用电脑一样工作。我知道如果没有关于机器的更多详细信息,可能很难提供信息,但如果您对它的来源有任何想法,那将会有所帮助。
最佳答案
我是 pathos
的作者。对困惑感到抱歉。您正在处理新旧编程接口(interface)的混合。
"new"(建议)接口(interface)是使用 pathos.pools
。旧界面链接到相同的对象,因此实际上有两种方法可以达到相同的目的。
multiprocessing.Pool
是 multiprocessing.Pool
的分支,唯一的区别是 multiprocessing
使用 pickle
和 multiprocess
使用 dill
。因此,我希望在大多数简单情况下速度相同。
上述池也可以在 pathos.pools._ProcessPool
中找到。 pathos
为几种类型的池提供了一个小的包装器,具有不同的后端,提供了扩展的功能。 pathos
包装的池是 pathos.pools.ProcessPool
(旧接口(interface)在 pathos.multiprocessing.Pool
中提供)。
首选接口(interface)是 pathos.pools.ProcessPool
。
还有 ParallelPool
,它使用不同的后端——它使用 ppft
而不是 multiprocess
。 ppft
是“并行 python”,它通过 subprocess
生成 python 进程并传递源代码(使用 dill.source
而不是序列化对象)——它是用于分布式计算,或者当通过源代码传递时是更好的选择。
因此,pathos.pools.ParallelPool
是首选接口(interface),而 pathos.parallel.ParallelPool
(以及 pathos
中的一些其他类似引用>) 由于遗留原因而徘徊——但它们在下面是同一个对象。
总结:
>>> import multiprocessing as mp
>>> mp.Pool()
<multiprocessing.pool.Pool object at 0x10fa6b6d0>
>>> import multiprocess as mp
>>> mp.Pool()
<multiprocess.pool.Pool object at 0x11000c910>
>>> import pathos as pa
>>> pa.pools._ProcessPool()
<multiprocess.pool.Pool object at 0x11008b0d0>
>>> pa.multiprocessing.Pool()
<multiprocess.pool.Pool object at 0x11008bb10>
>>> pa.pools.ProcessPool()
<pool ProcessPool(ncpus=4)>
>>> pa.pools.ParallelPool()
<pool ParallelPool(ncpus=*, servers=None)>
你可以看到 ParallelPool
有 servers
...因此是为分布式计算而设计的。
唯一剩下的问题是为什么 AssertionError
?那是因为 pathos
添加的包装器保留了一个池对象以供重用。因此,当您第二次调用 ParallelPool
时,您调用的是一个封闭池。您需要重新启动
池才能再次使用它。
>>> f = lambda x:x
>>> p = pa.pools.ParallelPool()
>>> p.map(f, [1,2,3])
[1, 2, 3]
>>> p.close()
>>> p.join()
>>> p.restart() # throws AssertionError w/o this
>>> p.map(f, [1,2,3])
[1, 2, 3]
>>> p.close()
>>> p.join()
>>> p.clear() # destroy the saved pool
ProcessPool
与 ParallelPool
具有相同的接口(interface),关于重新启动和清除已保存的实例。
关于python - pathos: parallel processing options - 有人能解释一下差异吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48990688/
标签和 Paper 之间的空间
我从NVIDIA手册Eg中复制了以下代码:__threadfence()。他们为什么有 在以下代码中使用了__threadfence()。我认为使用__syncthreads()而不是__thread
我在使用 SVN 更改列表和 svn diff 时遇到了一些麻烦.特别是我想获取特定修订范围的特定文件列表的更改历史记录。 SVN 变更列表似乎是完美的解决方案,所以我的方法是: svn change
我有两个 IP 地址列表。我需要将它们合并到三个文件中,交集,仅来自 list1 的文件和仅来自 list2 的文件。 我可以用 awk/diff 或任何其他简单的 unix 命令来做到这一点吗?如何
假设自上次更新(恢复)到我的 a.b 文件以来我做了一些更改。 此 a.b 文件也在存储库中更改。 现在我想将我所做的更改与 repos 更改进行比较。 如果我 svn revert 文件,我可以看到
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 7 年前。
我使用的是 openssl 1.0.1c , linux x86_64 我正在创建包含“hello”的文件(没有换行符) openssl dgst -sha256 hello_file i get :
假设我们有几个库。 有什么区别核心和 普通 图书馆?他们应该如何被认可,我们是否组织了两者的职责? +Common -Class1 +Core -Class2 +Lib1 has : Comm
如何在 SQLite 中计算以毫秒为单位的最小时间间隔? 好的,提供一些背景信息, 这是我的 table 的样子: link_budget table 所以有这个时间列,我想发出一个请求,以毫秒为单位
我想知道,乐观并发控制 (OCC) 和多版本并发控制 (MVCC) 之间的区别是什么? 到目前为止,我知道两者都是基于更新的版本检查。 在 OCC 中,我读到了没有获取读取访问锁的事务,仅适用于以后的
说到 SignalR,我有点菜鸟。刚刚开始四处探索和谷歌搜索它,我想知道是否有人可以向我解释完成的事情之间的一些差异。 在我见过的一些示例中,人们需要创建一个 Startup 类并定义 app.Map
我在 Ogre 工作,但这是一个一般的四元数问题。 我有一个对象,我最初对其应用旋转四元数 Q1。后来,我想让它看起来好像我最初通过不同的四元数 Q2 旋转了对象。 我如何计算四元数,该四元数将采用已
我了解 javascript 模块模式,但我使用两种类型的模块模式,并且想从架构 Angular 了解它们之间的区别。 // PATTERN ONE var module = (function()
我有两个具有完全相同键的 JSON。 val json1 = """{ 'name': 'Henry', 'age' : 26, 'activities' : {
我发现使用 VBA 在 Excel 中复制单个文件有两种不同的方法。一是文件复制: FileCopy (originalPath), (pathToCopyTo) 另一个是名称: Name (orig
我想知道查找两个 float 组之间差异的绝对值的最有效方法是什么? 是否是以下内容: private float absDifference(float[] vector1, float[] vec
我有一个关于 wicket getApplication 的问题。 getApplication() 和 getSession().getApplication 有什么区别? 部署 wicket 应用
我刚刚开始使用activemq,我有一个关于追溯消费者的问题,为了启用这个功能,你需要有一个持久的订阅。但是在主题上启用和不启用追溯的持久订阅有什么区别? activemq 文档说。 http://a
我有两个具有完全相同键的 JSON。 val json1 = """{ 'name': 'Henry', 'age' : 26, 'activities' : {
得到另一个 Erlang 二进制表示查询('因为这就是我最近正在阅读的内容,并且需要二进制协议(protocol)实现)。 如果我正确理解了类型说明符,那么对于“浮点”类型值,8 字节表示似乎很好(这
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 4 年前。 Improve this ques
我是一名优秀的程序员,十分优秀!