python - 处理 IPython 集群中的各种资源需求-6ren

python - 处理 IPython 集群中的各种资源需求

转载作者：行者123 更新时间：2023-11-28 22:00:37

25

4

我正在使用基于 PBS 的集群并在一组节点上并行运行 IPython，每个节点有 24 或 32 个内核，内存范围为 24G 到 72G；这种异质性是由于我们的集群具有历史。此外，我有一些作业要发送到 IPython 集群，这些作业具有不同的资源要求(内核和内存)。我正在寻找一种方法来将作业提交到了解其资源需求和可用引擎的 ipython 集群。我想有一种方法可以使用 IPython 功能优雅地处理这种情况，但我还没有找到。关于如何进行的任何建议？

最佳答案

除了您表示已经获得的图形依赖性之外，IPython 任务还可以具有函数依赖性。这些可以是任意函数，比如任务本身。函数依赖在实际任务之前运行，如果它返回 False 或引发特殊的 parallel.UnmetDependency 异常，任务将不会在该引擎上运行，并将在其他地方重试。

因此，要使用它，您需要一个函数来检查您需要的任何指标。例如，假设我们只想在您的节点上使用最少的内存运行任务。这是一个检查系统总内存(以字节为单位)的函数:

def minimum_mem(limit):
    import sys
    if sys.platform == 'darwin': # or BSD in general?
        from subprocess import check_output
        mem = int(check_output(['sysctl', '-n', 'hw.memsize']))
    else: # linux
        with open("/proc/meminfo") as f:
            for line in f:
                if line.startswith("MemTotal"):
                    mem = 1024 * int(line.split()[1])
                    break
    return mem >= limit

kB = 1024.
MB = 1024 * kB
GB = 1024 * MB

所以 minimum_mem(4 * GB) 将返回 True 如果您的系统上至少有 4GB 内存。如果您想检查可用内存而不是总内存，您可以使用/proc/meminfo 中的 MemFree 和 Inactive 值来确定尚未使用的内容。

现在您可以通过应用 @parallel.depend 装饰器只将任务提交给具有足够 RAM 的引擎:

@parallel.depend(minimum_mem, 8 * GB)
def big_mem_task(n):
    import os, socket
    return "big", socket.gethostname(), os.getpid(), n

amr = view.map(big_mem_task, range(10))

同样，您可以根据 CPU 数量应用限制(multiprocessing.cpu_count 是一个有用的函数)。

这里是 a notebook它使用这些来限制一些愚蠢任务的分配。

通常，该模型是每个核心(而不是每个节点)运行一个 IPython 引擎，但如果您有特定的多核任务，那么您可能希望使用较小的数量(例如 N/2或 N/4)。如果您的任务真的很大，那么您实际上可能希望将其限制为每个节点一个引擎。如果您在每个节点上运行更多的引擎，那么您在同时运行高资源任务时要小心一些。正如我写的那样，这些检查没有考虑同一节点上的其他任务，所以如果一个节点有 16 GB 的 RAM，并且你有两个任务，每个任务需要 10 个，你需要更加小心你如何跟踪可用资源。

关于python - 处理 IPython 集群中的各种资源需求，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14506182/

25

4

0

文章推荐： python - 使用 numpy.int32 时的浮点近似

文章推荐： python - 从 .csv 文件中读取值并将它们转换为 float 组

文章推荐： python - 如何从循环中的函数中断 Python while 循环

需求(功能、非功能和用户需求)
您能否提供有关网站社交网络(例如 Facebook)类型(功能性、非功能性和用户要求)要求的示例？提前谢谢最佳答案以下是 Facebook 应具备的要求的一些示例。然而，值得一提的是:对于每种类
java - Liferay Unresolved 需求
我需要在另一个 Java 项目的 liferay 模块项目中使用一些类。我正在使用 gradle，当我部署应用程序时，即使 gradle 编译了我的 jar 文件，我也会收到 Unresolved 需
java - 如何解决Android中的静态 fragment 需求？
我最近发现了类似于button.setText(“Hello World”);的代码行如果您按如下方式分配按钮，则 onCreate() 方法中将抛出 nullPointerException: B
python - PYOMO 优化以满足供给 < 需求
我有一些基于成本的供应链管理代码，其中供应尝试满足需求，但这仅在供应大于需求时才有效。有什么方法可以优化它以两种方式工作(即当 supply > demand 和 supply = model.dem
c# - 使用属性来满足接口(interface)需求
好吧，我快想多了。有没有一种方法可以组合接口(interface)和属性，使实现类中的特性属性满足接口(interface)契约？在我的应用程序中，我想显示一个事件列表，它是系统中事件的集合，例如新
python - 预测数周内产品的 future 需求
我想创建一个模型，在每个步骤中预测每个产品在多周内的 future 需求(预测每个产品明年的每周需求) 我有一些小尺寸(大约 100-200 条记录)的 csv。这里有关 CSV 列的信息:- 第一
Python Django 需求.txt
我有一个包含我所有依赖项的 requirements.txt 文件，但它没有被正确处理: pip install -r requirements.txt 后，我得到以下 pip freeze: arg
java - 测量方法调用的 I/O 需求
我对 Java EE 应用程序的性能测量(CPU 和磁盘 I/O 需求)很感兴趣。对于CPU 我已经想出了如何测量每个方法调用的CPU 需求。通过在每个方法的开始和结束时调用 java.lang.m
azure - 如何获取 yaml-pipeline 需求？
如何获取从 yaml 文件创建的管道的需求？ yaml 文件包含需求: ... jobs: - job: my_job displayName: My Job pool: name:
javascript - AngularJS 中的链式 promise /需求
我的目标: 构建一个 AngularJS 服务 (MapService)，它初始化 (MapService.initMap()) 第 3 方控件 (Esri ArcGIS Map) 并返回对我的 ma
ruby-on-rails - 更优雅地处理项目中的 Redis 需求？
我在我的一个项目中使用了 redis，并且有一个带有 redis = Redis.new 的初始化器并使用了 redis gem。问题是，如果 Redis 没有运行，我将无法执行简单的数据库迁移之类的
javascript - proxyquire 如何处理代理模块的二级(间接)需求？
如果我们有三个模块名称 A、B 和 C，那么模块 A 需要 B 和 B 需要 C:这个调用会产生什么效果？ var A = proxyquire('A', {'C': mockedModule}) 模
gradle - Liferay 7 服务模块 Unresolved 需求
我正在为 Liferay 7 开发一些功能。我知道仍处于 beta 版本，但我在 OSGi 包依赖项方面遇到了一些麻烦。当我尝试部署服务项目时，部署时发生错误 Unresolved requireme
javascript - 在 javascript 闭包中包装一些 Assets 需求
我有一个 list 文件 partials.js，其中包含: //= require_tree ./partials 然后 ./partials/ 中的每个咖啡文件都包含以下内容: $ -> #
python - 如何像 pip 一样卡住 brew 需求？
在 brew 中有没有一种方法或特殊命令可以将安装的包卡住到 requirements.txt 文件中，就像在 python 中使用 pip 一样？然后从该文件快速重新安装它们？最佳答案使用Hom
kubernetes - 如何估算 Kubernetes pod 的 CPU 需求？
我正在尝试在 g1 GKE 实例(g1 实例有 1 个 vCPU，或 1000 毫核)中运行一个小型应用程序，并且在调度 pod 时遇到 CPU 请求限制问题。有 4 个 pod，每个都是应用程序的不
c++ - 将依赖列表(需求)与 conanfile.py 分开
我们计划为我们的 C++ 代码建立柯南存储库。我们只想向开发人员公开依赖项列表 (lib/version@user/channel)，而不是我们放在 conanfile.py 中的逻辑检查。这个包装器
symfony - 父请求和 ESI 子请求之间有任何通信( Varnish 、 session 需求)吗？
我正在尝试研究 Varnish 。我的问题是。我确实有一个主要请求/响应，我想使用 Varnish 缓存它。 html结构内部有ESI标签。我想要很多。一个标签具有较长的 ttl，其他标签则具有 t
c - 在运行时或编译/链接时绑定(bind)模块的接口(interface)需求，哪个更好？
我有一个在运行时或编译/链接时连接接口(interface)的问题或最佳方法。对于我的嵌入式项目，设备驱动程序和 I/O 具有需要绑定(bind)(即粘合)到其相应接口(interface)依赖项的接
swift - 需要通过使用需求的特定子类(或符合它的类型)来满足 Swift 协议(protocol)需求
我有一个我创建的协议(protocol)(在 Swift 4.2 中)，它的要求之一是一个与协议(protocol)本身类型相同的属性。例如，我有一个这样定义的协议(protocol): proto

首页

博学

6Ren·AI

商城

python - 处理 IPython 集群中的各种资源需求