python - 如何将线程固定到具有预定内存池对象的内核？ (80 核 Nehalem 架构 2Tb 内存)-6ren

python - 如何将线程固定到具有预定内存池对象的内核？ (80 核 Nehalem 架构 2Tb 内存)

转载作者：太空狗更新时间：2023-10-29 17:20:27

在带有 2Tb DRAM 的 80 核 (160HT) nehalem 架构上运行一些测试后，我遇到了一个小的 HPC 问题:

当每个线程开始请求有关“错误”套接字上的对象的信息时，具有 2 个以上套接字的服务器开始停顿很多(延迟)，即请求来自正在处理一个套接字上的某些对象的线程拉取实际上位于另一个插槽上的 DRAM 中的信息。

尽管我知道它们正在等待远程套接字返回请求，但内核似乎已被 100% 使用。

由于大部分代码都是异步运行的，因此重写代码要容易得多，因此我可以只解析从一个套接字上的线程到另一个套接字上的线程的消息(没有锁定等待)。此外，我想将每个线程锁定到内存池，这样我就可以更新对象，而不是在垃圾收集器上浪费时间 (~30%)。

因此问题:

如何在 Python 中将线程固定到具有预定内存池对象的内核？

更多背景信息:

当您将 ZeroMQ 放在中间并在每个 ZMQworker 管理的内存池之间传递消息时，Python 可以毫无问题地运行多核。在 ZMQ 的 8M msg/second 下，对象的内部更新花费的时间比管道可以填充的时间长。这一切都在这里描述:http://zguide.zeromq.org/page:all#Chapter-Sockets-and-Patterns

因此，通过稍微过度简化，我生成了 80 个 ZMQworker 进程和 1 个 ZMQrouter，并使用大量对象(实际上是 5.84 亿个对象)加载上下文。从这个“起点”开始，对象需要交互才能完成计算。

思路是这样的:

如果“对象 X”需要与“对象 Y”交互并且在python线程的本地内存池，然后交互应该直接做。
如果“对象 Y”在同一个池中不可用，那么我希望它通过 ZMQrouter 发送消息，让路由器返回一个在稍后的某个时间点响应。我的架构是非阻塞的，因此在特定 python 线程中发生的事情会继续进行，而无需等待 zmqRouters 响应。即使对于位于同一套接字但位于不同内核上的对象，我也宁愿不进行交互，因为我更喜欢进行干净的消息交换，而不是让 2 个线程操作同一内存对象。

为此我需要知道:

如何找出给定 python 进程(线程)的套接字运行。
如何将该特定套接字上的内存池分配给 python 进程(某些 malloc 限制或类似限制，以便内存池的总和不会将内存池从一个套接字推送到另一个套接字)
我没有想到的事情。

但我无法在 python 文档中找到有关如何执行此操作的引用，并且在谷歌上我一定是在搜索错误的东西。

更新:

关于“为什么在 MPI 架构上使用 ZeroMQ？”的问题，请阅读主题:Spread vs MPI vs zeromq?因为我正在处理的应用程序是为分布式部署而设计的，即使它是在 MPI 更合适的架构上进行测试的。

更新 2:

关于问题:

“如何在 Python 中使用预定的内存池将线程固定到内核 (3)”，答案在 psutils 中。 :

>>> import psutil
>>> psutil.cpu_count()
4
>>> p = psutil.Process()
>>> p.cpu_affinity()  # get
[0, 1, 2, 3]
>>> p.cpu_affinity([0])  # set; from now on, this process will run on CPU #0 only
>>> p.cpu_affinity()
[0]
>>>
>>> # reset affinity against all CPUs
>>> all_cpus = list(range(psutil.cpu_count()))
>>> p.cpu_affinity(all_cpus)
>>>

可以将 worker 固定到一个核心，从而可以有效地利用 NUMA(查找您的 CPU 类型以验证它是 NUMA 架构!)

第二个要素是确定内存池。这可以用 psutils 来完成以及 resource library :

最佳答案

您可能低估了这个问题，没有 super 简单的方法可以完成您想要的。作为一般准则，您需要在操作系统级别工作以按照您想要的方式进行设置。您想要使用所谓的“CPU 亲和性”和“内存亲和性”，并且您需要认真考虑您的系统架构和软件架构才能把事情做对。在真正的 HPC 中，命名的“亲和性”通常由 MPI 库处理，例如 Open MPI。您可能想考虑使用一个并让您的不同进程由该 MPI 库处理。 mpi4py包可以提供操作系统、MPI库和Python之间的接口(interface)。

您还需要了解线程和进程的概念以及操作系统设置。虽然对于 CPU 时间调度程序，线程是要调度的任务，因此理论上可以具有单独的亲和性，但我只知道整个进程的亲和性掩码，即一个进程中的所有线程。对于控制内存访问，NUMA(非统一内存访问)是正确的关键字，您可能需要查看 http://linuxmanpages.com/man8/numactl.8.php

在任何情况下，您都需要阅读有关亲和性主题的文章，并且可能希望开始阅读有关 CPU/内存亲和性的 Open MPI 常见问题解答: http://www.open-mpi.de/faq/?category=tuning#paffinity-defs

如果您想在不使用 MPI 库的情况下实现您的目标，请查看包 util-linux 或 schedutils 和 numactl您的 Linux 发行版以获得有用的命令行工具，例如 taskset，您可以使用这些工具，例如从 Python 内部调用以便为某些进程 ID 设置关联掩码。

这篇文章似乎生动地描述了 MPI 库如何帮助您解决问题:

http://blogs.cisco.com/performance/open-mpi-v1-5-processor-affinity-options/

这个 SO 答案描述了您如何将硬件架构一分为二:https://stackoverflow.com/a/11761943/145400

一般来说，我想知道您使用的机器是否适合这项任务，或者您是否可能在错误的一端进行了优化。如果您在一台机器内发送消息并达到内存带宽限制，我不确定 ZMQ(通过 TCP/IP，对吧？)是否是执行消息传递的正确工具。回到 MPI， HPC 应用程序的消息传递接口(interface)...

关于python - 如何将线程固定到具有预定内存池对象的内核？ (80 核 Nehalem 架构 2Tb 内存)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18057029/

文章推荐： python - EXP(ORT) 密码和 M2Crypto/OpenSSL

文章推荐： c - 如何使用GDB调试带SMP(对称多处理器)的QEMU？

文章推荐： python - Flask 重定向 url 与 anchor

文章推荐： c 类型等价的编译器

PHP:每周和每隔一周的计划(预定)
我对我接管的项目有疑问。我正在转换其他人编写的 MS Access 应用程序并将其转换为 MySQL/PHP Web 应用程序。其中大部分已经完成，但是，当涉及到此应用程序的调度部分时，我处于停滞状态
java - 预定 Spring 方法中的昂贵操作
我有一个带有 @Scheduled 注释的方法。此方法包含长时间运行、昂贵的操作。我担心当计划的方法开始运行时应用程序会变慢。有什么办法可以为预定方法分配优先级吗？在 Spring 中启动低优先级后台
javascript - 网站上自动/预定 JavaScript
我的大学有一个预订项目房间的网站；但除非你很幸运或者半夜醒着，否则要订到房间并不容易。因此，我编写了一个 JS 片段来填写所有必要的字段并提交表单。但是我如何自动化这个过程呢？我的目的基本上是加载
message-queue - 处理数百万条定时(预定)消息的解决方案？
我正在评估处理大量排队消息的可能解决方案，这些消息必须在特定日期和时间交付给工作人员。执行它们的结果主要是对存储数据的更新，它们最初可能是也可能不是由用户操作触发的。例如，想想你在一个假设的大型星际
java - Spring 预定 fixedRateString 作为 Duration
@Scheduled documentation here声明 fixedRateString值可以是 the delay in milliseconds as a String value, e.g
web-services - 优点和缺点 - 在同一台服务器上运行(预定)后台任务和 Web 请求处理
关闭。这个问题是opinion-based .它目前不接受答案。想改善这个问题吗？更新问题，以便可以通过 editing this post 用事实和引文回答问题. 4年前关闭。 Improve t
spring - Spring Boot Batch 中的 Hibernate_sequence 错误(预定)
我有一个有趣的情况。我解析了几个新闻发布网站，想通过调度程序将它们保存到数据库中。但是保存时出现错误。由于交易后写条件 described here . 我的模型类是 @Entity @Table(n
Java 并发实践 “Listing 7.9. Interrupting a task in a dedicated thread.” 。预定 taskThread.interrupt() 的目的是什么？
我正在阅读 Java Concurrency in Practice 并遇到以下代码片段。 public static void timedRun(final Runnable r,
azure - 预定 1 :1 copy of tables between Azure SQL databases using Data Factory without specifying table schema
使用 Azure 数据工厂，是否可以对驻留在 Azure SQL 数据库中的多个(不是全部)表中的所有行执行预定的 1:1 复制/克隆到另一个 Azure SQL 数据库(在本例中为 Azure SQ

太空狗

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 如何将线程固定到具有预定内存池对象的内核？ (80 核 Nehalem 架构 2Tb 内存)