- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
在带有 2Tb DRAM 的 80 核 (160HT) nehalem 架构上运行一些测试后,我遇到了一个小的 HPC 问题:
当每个线程开始请求有关“错误”套接字上的对象的信息时,具有 2 个以上套接字的服务器开始停顿很多(延迟),即请求来自正在处理一个套接字上的某些对象的线程拉取实际上位于另一个插槽上的 DRAM 中的信息。
尽管我知道它们正在等待远程套接字返回请求,但内核似乎已被 100% 使用。
由于大部分代码都是异步运行的,因此重写代码要容易得多,因此我可以只解析从一个套接字上的线程到另一个套接字上的线程的消息(没有锁定等待)。此外,我想将每个线程锁定到内存池,这样我就可以更新对象,而不是在垃圾收集器上浪费时间 (~30%)。
因此问题:
如何在 Python 中将线程固定到具有预定内存池对象的内核?
更多背景信息:
当您将 ZeroMQ 放在中间并在每个 ZMQworker 管理的内存池之间传递消息时,Python 可以毫无问题地运行多核。在 ZMQ 的 8M msg/second 下,对象的内部更新花费的时间比管道可以填充的时间长。这一切都在这里描述:http://zguide.zeromq.org/page:all#Chapter-Sockets-and-Patterns
因此,通过稍微过度简化,我生成了 80 个 ZMQworker 进程和 1 个 ZMQrouter,并使用大量对象(实际上是 5.84 亿个对象)加载上下文。从这个“起点”开始,对象需要交互才能完成计算。
思路是这样的:
为此我需要知道:
但我无法在 python 文档中找到有关如何执行此操作的引用,并且在谷歌上我一定是在搜索错误的东西。
更新:
关于“为什么在 MPI 架构上使用 ZeroMQ?”的问题,请阅读主题:Spread vs MPI vs zeromq?因为我正在处理的应用程序是为分布式部署而设计的,即使它是在 MPI 更合适的架构上进行测试的。
更新 2:
关于问题:
“如何在 Python 中使用预定的内存池将线程固定到内核 (3)”,答案在 psutils 中。 :
>>> import psutil
>>> psutil.cpu_count()
4
>>> p = psutil.Process()
>>> p.cpu_affinity() # get
[0, 1, 2, 3]
>>> p.cpu_affinity([0]) # set; from now on, this process will run on CPU #0 only
>>> p.cpu_affinity()
[0]
>>>
>>> # reset affinity against all CPUs
>>> all_cpus = list(range(psutil.cpu_count()))
>>> p.cpu_affinity(all_cpus)
>>>
可以将 worker 固定到一个核心,从而可以有效地利用 NUMA(查找您的 CPU 类型以验证它是 NUMA 架构!)
第二个要素是确定内存池。这可以用 psutils 来完成以及 resource library :
最佳答案
您可能低估了这个问题,没有 super 简单的方法可以完成您想要的。作为一般准则,您需要在操作系统级别工作以按照您想要的方式进行设置。您想要使用所谓的“CPU 亲和性”和“内存亲和性”,并且您需要认真考虑您的系统架构和软件架构才能把事情做对。在真正的 HPC 中,命名的“亲和性”通常由 MPI 库处理,例如 Open MPI。您可能想考虑使用一个并让您的不同进程由该 MPI 库处理。 mpi4py包可以提供操作系统、MPI库和Python之间的接口(interface)。
您还需要了解线程和进程的概念以及操作系统设置。虽然对于 CPU 时间调度程序,线程是要调度的任务,因此理论上可以具有单独的亲和性,但我只知道整个进程的亲和性掩码,即一个进程中的所有线程。对于控制内存访问,NUMA(非统一内存访问)是正确的关键字,您可能需要查看 http://linuxmanpages.com/man8/numactl.8.php
在任何情况下,您都需要阅读有关亲和性主题的文章,并且可能希望开始阅读有关 CPU/内存亲和性的 Open MPI 常见问题解答: http://www.open-mpi.de/faq/?category=tuning#paffinity-defs
如果您想在不使用 MPI 库的情况下实现您的目标,请查看包 util-linux
或 schedutils
和 numactl
您的 Linux 发行版以获得有用的命令行工具,例如 taskset
,您可以使用这些工具,例如从 Python 内部调用以便为某些进程 ID 设置关联掩码。
这篇文章似乎生动地描述了 MPI 库如何帮助您解决问题:
http://blogs.cisco.com/performance/open-mpi-v1-5-processor-affinity-options/
这个 SO 答案描述了您如何将硬件架构一分为二:https://stackoverflow.com/a/11761943/145400
一般来说,我想知道您使用的机器是否适合这项任务,或者您是否可能在错误的一端进行了优化。如果您在一台机器内发送消息并达到内存带宽限制,我不确定 ZMQ(通过 TCP/IP,对吧?)是否是执行消息传递的正确工具。回到 MPI, HPC 应用程序的消息传递接口(interface)...
关于python - 如何将线程固定到具有预定内存池对象的内核? (80 核 Nehalem 架构 2Tb 内存),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18057029/
我的一位教授给了我们一些考试练习题,其中一个问题类似于下面(伪代码): a.setColor(blue); b.setColor(red); a = b; b.setColor(purple); b
我似乎经常使用这个测试 if( object && object !== "null" && object !== "undefined" ){ doSomething(); } 在对象上,我
C# Object/object 是值类型还是引用类型? 我检查过它们可以保留引用,但是这个引用不能用于更改对象。 using System; class MyClass { public s
我在通过 AJAX 发送 json 时遇到问题。 var data = [{"name": "Will", "surname": "Smith", "age": "40"},{"name": "Wil
当我尝试访问我的 View 中的对象 {{result}} 时(我从 Express js 服务器发送该对象),它只显示 [object][object]有谁知道如何获取 JSON 格式的值吗? 这是
我有不同类型的数据(可能是字符串、整数......)。这是一个简单的例子: public static void main(String[] args) { before("one"); }
嗨,我是 json 和 javascript 的新手。 我在这个网站找到了使用json数据作为表格的方法。 我很好奇为什么当我尝试使用 json 数据作为表时,我得到 [Object,Object]
已关闭。此问题需要 debugging details 。目前不接受答案。 编辑问题以包含 desired behavior, a specific problem or error, and the
我听别人说 null == object 比 object == null check 例如: void m1(Object obj ) { if(null == obj) // Is thi
Match 对象 提供了对正则表达式匹配的只读属性的访问。 说明 Match 对象只能通过 RegExp 对象的 Execute 方法来创建,该方法实际上返回了 Match 对象的集合。所有的
Class 对象 使用 Class 语句创建的对象。提供了对类的各种事件的访问。 说明 不允许显式地将一个变量声明为 Class 类型。在 VBScript 的上下文中,“类对象”一词指的是用
Folder 对象 提供对文件夹所有属性的访问。 说明 以下代码举例说明如何获得 Folder 对象并查看它的属性: Function ShowDateCreated(f
File 对象 提供对文件的所有属性的访问。 说明 以下代码举例说明如何获得一个 File 对象并查看它的属性: Function ShowDateCreated(fil
Drive 对象 提供对磁盘驱动器或网络共享的属性的访问。 说明 以下代码举例说明如何使用 Drive 对象访问驱动器的属性: Function ShowFreeSpac
FileSystemObject 对象 提供对计算机文件系统的访问。 说明 以下代码举例说明如何使用 FileSystemObject 对象返回一个 TextStream 对象,此对象可以被读
我是 javascript OOP 的新手,我认为这是一个相对基本的问题,但我无法通过搜索网络找到任何帮助。我是否遗漏了什么,或者我只是以错误的方式解决了这个问题? 这是我的示例代码: functio
我可以很容易地创造出很多不同的对象。例如像这样: var myObject = { myFunction: function () { return ""; } };
function Person(fname, lname) { this.fname = fname, this.lname = lname, this.getName = function()
任何人都可以向我解释为什么下面的代码给出 (object, Object) 吗? (console.log(dope) 给出了它应该的内容,但在 JSON.stringify 和 JSON.parse
我正在尝试完成散点图 exercise来自免费代码营。然而,我现在只自己学习了 d3 几个小时,在遵循 lynda.com 的教程后,我一直在尝试确定如何在工具提示中显示特定数据。 This code
我是一名优秀的程序员,十分优秀!