Python多处理安全地写入文件-6ren

Python多处理安全地写入文件

转载作者：IT老高更新时间：2023-10-28 20:24:48

27

4

我正在尝试解决一个涉及大量子问题的大数值问题，并且我正在使用 Python 的多处理模块(特别是 Pool.map)将不同的独立子问题拆分到不同的核心上。每个子问题都涉及计算大量子子问题，如果尚未由任何进程计算它们，我试图通过将它们存储到文件中来有效地内存这些结果，否则跳过计算并从文件中读取结果。

我遇到了文件的并发问题:不同的进程有时会检查是否已经计算了子子问题(通过查找将存储结果的文件)，看到它没有，运行计算，然后尝试将结果同时写入同一个文件。如何避免写这样的冲突？

最佳答案

@GP89 提到了一个很好的解决方案。使用队列将写入任务发送到对文件具有唯一写入权限的专用进程。所有其他工作人员都具有只读访问权限。这将消除碰撞。这是一个使用 apply_async 的示例，但它也适用于 map:

import multiprocessing as mp
import time

fn = 'c:/temp/temp.txt'

def worker(arg, q):
    '''stupidly simulates long running process'''
    start = time.clock()
    s = 'this is a test'
    txt = s
    for i in range(200000):
        txt += s 
    done = time.clock() - start
    with open(fn, 'rb') as f:
        size = len(f.read())
    res = 'Process' + str(arg), str(size), done
    q.put(res)
    return res

def listener(q):
    '''listens for messages on the q, writes to file. '''

    with open(fn, 'w') as f:
        while 1:
            m = q.get()
            if m == 'kill':
                f.write('killed')
                break
            f.write(str(m) + '\n')
            f.flush()

def main():
    #must use Manager queue here, or will not work
    manager = mp.Manager()
    q = manager.Queue()    
    pool = mp.Pool(mp.cpu_count() + 2)

    #put listener to work first
    watcher = pool.apply_async(listener, (q,))

    #fire off workers
    jobs = []
    for i in range(80):
        job = pool.apply_async(worker, (i, q))
        jobs.append(job)

    # collect results from the workers through the pool result queue
    for job in jobs: 
        job.get()

    #now we are done, kill the listener
    q.put('kill')
    pool.close()
    pool.join()

if __name__ == "__main__":
   main()

关于Python多处理安全地写入文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13446445/

27

4

0

文章推荐： java - 在方法参数中初始化数组

文章推荐： java - 如何使用字符串有效地管理内存？

文章推荐： java - Android SharedPreferences 最佳实践

java - 我可以(安全地)给一个与方法名称相同的变量吗？
在我的 java 代码中，我做了类似的事情: int sleep = 0; sleep(sleep); sleep++; 被bos指出不好。它不能在 php 中正常工作。在 java 中使用上述代码
c++ - 我如何(安全地)中断单独线程上的计算？
我有一个程序使用第 3 方库进行一些计算，我在与主应用程序不同的线程上启动该程序。不幸的是，此计算可能需要很长时间，并且不提供进度更新和取消的接口(interface)。为了拥有这样的界面，我想创建
c++ - 如何从单独的字符串(安全地)构建完整路径字符串？
C++ 是否有任何等效于 python 的函数 os.path.join？基本上，我正在寻找将文件路径的两个(或多个)部分组合在一起的东西，这样您就不必担心确保这两个部分完美地结合在一起。如果它在 Q
javascript - 如何通过互联网向用户公开交互式 neo4j 可视化(安全地)？
我正试图站起来(非商业)web application使用 neo4j Community 3.5.2 作为后端。应用程序以两种方式与图形交互: 服务器端(安全的)用 flask 编写新的节点和关系
php - 外部数据库连接 -(安全地) - MySQL/PHP
我正在开发一个将有许多外部用户的在线应用程序。至于现在，我的连接方法是为所有用户托管一个中央数据库，而他们从自己的服务器文件连接。方法: PHP 连接文件(托管在他们的服务器上；文件由我提供) >>
c++ - 是否可以*安全地*从函数返回 TCHAR*？
我创建了一个将所有事件通知代码转换为字符串的函数。真的很简单。我有一堆常量，比如 const _bstr_t DIRECTSHOW_MSG_EC_ACTIVATE("A video window i
java - ReSTLet - 安全地(线程方式)将信息从过滤器传递到资源
我想将(附加)信息从过滤器传递到资源。我目前尝试这样做的方式是，在 Filter 中: getContext().getAttributes().put("additionalInformation"
c++ - 我怎样才能(安全地)除以一个最大值，得到一个浮点值？
我想计算转换系数。为此，我必须除以例如的最大值。 ushort 为 uchar 的最大值。我想通过将参数传递给函数或类型名来动态地执行此操作。然后我想选择最大值并执行计算。有两个问题: 如何动态选
java - 用户如何(安全地)用 Java 编写自己的过滤器
我希望我的用户在用 Java 请求列表时能够编写自己的过滤器。选项 1) 我正在考虑将 JavaScript 与 Rhino 结合使用。我将用户的过滤器作为 javascript 字符串获取。然后
html - 不仅从不同的子域而且从不同的域(安全地)提供图像是否符合 PCI 标准？
(安全地)提供来自不同域的图像是否符合 PCI 标准？我搜索了 PCI DSS 2.0 PDF，但没有找到任何引用资料。最佳答案图像不符合 PCI 合规性。 PCI DSS covers the
java - 如何强制提交 Spring - 安全地 hibernate 事务
我们正在将 spring 和 hibernate 用于 web 应用程序:该应用程序有一个购物车，用户可以在其中放置商品。为了保存不同登录名之间要查看的项目，购物车中的项目值存储在表中。提交购物车时，
ruby-on-rails - 在 Ruby 中(安全地)解释用户输入的表达式
我正在为多个客户创建一个具有电子商务元素的 Rails 应用程序 - 我希望这些客户能够在管理区域中指定计算运费的公式；因为方法可能不同。让我们假装一下，我允许他们输入 ruby 代码，然后我稍
java - 如何(安全地)删除 Eclipse 中不必要的 Maven 依赖项？
我正在 Eclipse 中开发一个 Java 项目，使用 Maven 构建和管理依赖项。该项目分布在 5 个 Eclipse 项目中，其中一个是父 POM。我正在研究基于另一个团队实现的更复杂服务器的
.net - 我可以(安全地)在 ADO.NET 数据服务中使用 ThreadStatic 属性吗？
我想在 ADO.NET 数据服务中存储每线程数据。在线程特定的静态变量上使用 ThreadStatic 属性是否安全，或者我会遇到问题吗？我担心的是，我的 ThreadStatic 变量在请求完成并且
python - 如何在 Python 2 和 Python 3 中生成密码？安全地？
Stackoverflow 上至少有一篇与此主题相关的帖子:Generate password in python 你会发现这个主题甚至在 PEP 中也受到了一些批评。这里提到:https://www
python - 可以(安全地)从 linux 上的自定义 python 安装中删除什么，以使其更小
对于我工作中的一个项目，我需要创建一个独立的 Python 安装(来自源代码)。然而，完整的目录占用大约 90MB 的磁盘空间，虽然不多，但太多了，无法一遍又一遍地复制。我可以从自定义 python
python - 如何(安全地)将字典转换为 Python 中 sqlite 的 UPDATE 语句？
例如，我有一张学生表，我有一本 Python 字典 mydict = {"fname" : "samwise", "lname" : "gamgee", "age" : 13} 我怎样才能安全地生成一
c++ - 在 C++11 中，您能否始终(安全地)用空初始化器替换 memset() 初始化？
我经常在代码中遇到使用 memset 手动零初始化的 POD 结构，如下所示: struct foo; memset(&foo, 0, sizeof(foo)); 我检查了 C++11 标准，它说:“

首页

博学

6Ren·AI

商城

Python多处理安全地写入文件