python - 如何限制没有终端或多处理库的 python 脚本使用的 CPU 数量？-6ren

python - 如何限制没有终端或多处理库的 python 脚本使用的 CPU 数量？

转载作者：行者123 更新时间：2023-12-01 08:00:45

54

4

我的主要问题是发出here 。由于还没有人给出解决方案，我决定寻找一种解决方法。我正在寻找一种使用 python 代码限制 python 脚本 CPU 使用率的方法(不是优先级，而是 CPU 核心数量)。我知道我可以使用多处理库(池等)来做到这一点，但我不是使用多处理运行它的人。所以，我不知道该怎么做。我也可以通过终端执行此操作，但该脚本正在由另一个脚本导入。不幸的是，我没有能力通过终端调用它。

tl;dr:如何限制Python脚本的CPU使用率(核心数)，该脚本正在由另一个脚本导入，我什至不知道为什么它并行运行，没有通过终端运行它。请检查下面的代码片段。

导致问题的代码片段:

from sklearn.datasets import load_digits
from sklearn.decomposition import IncrementalPCA
import numpy as np

X, _ = load_digits(return_X_y=True)

#Copy-paste and increase the size of the dataset to see the behavior at htop.
for _ in range(8):
    X = np.vstack((X, X))

print(X.shape)

transformer = IncrementalPCA(n_components=7, batch_size=200)

#PARTIAL FIT RUNS IN PARALLEL! GOD WHY?
---------------------------------------
transformer.partial_fit(X[:100, :])
---------------------------------------
X_transformed = transformer.fit_transform(X)

print(X_transformed.shape)

版本:

Python 3.6
joblib 0.13.2
scikit-learn 0.20.2
numpy 1.16.2

更新:不起作用。感谢您的澄清@Darkonaut。可悲的是，我已经知道这是行不通的，而且我已经在问题标题上明确说明了，但我猜人们不会阅读。我想我做错了。我已经根据 @Ben Chaliah Ayoub answer 更新了代码片段。似乎什么都没有改变。我还想指出一点:我并不想在多个内核上运行此代码。此行 transformer.partial_fit(X[:100, :]) 在多个核心上运行(出于某种原因)，并且它没有 n_jobs 或任何内容。另请注意，我的第一个示例和原始代码未使用池或类似的东西进行初始化。我无法首先设置核心数(因为没有这样的地方)。但现在它有了一个位置，但它仍然在多个核心上运行。您可以自己测试一下。 (下面的代码)这就是我寻找解决方法的原因。

from sklearn.datasets import load_digits
from sklearn.decomposition import IncrementalPCA
import numpy as np
from multiprocessing import Pool, cpu_count
def run_this():
    X, _ = load_digits(return_X_y=True)
    #Copy-paste and increase the size of the dataset to see the behavior at htop.
    for _ in range(8):
        X = np.vstack((X, X))
    print(X.shape)
    #This is the exact same example taken from sckitlearn's IncrementalPCA website.
    transformer = IncrementalPCA(n_components=7, batch_size=200)
    transformer.partial_fit(X[:100, :])
    X_transformed = transformer.fit_transform(X)
    print(X_transformed.shape)
pool= Pool(processes=1)
pool.apply(run_this)

更新:因此，我尝试使用 this 设置 blas 线程。在导入 numpy 之前在我的代码中，但它(再次)不起作用。还有其他建议吗？最新阶段的代码可以在下面找到。

鸣谢:@Amir

from sklearn.datasets import load_digits
from sklearn.decomposition import IncrementalPCA
import os
os.environ["OMP_NUM_THREADS"] = "1" # export OMP_NUM_THREADS=1
os.environ["OPENBLAS_NUM_THREADS"] = "1" # export OPENBLAS_NUM_THREADS=1
os.environ["MKL_NUM_THREADS"] = "1" # export MKL_NUM_THREADS=1
os.environ["VECLIB_MAXIMUM_THREADS"] = "1" # export VECLIB_MAXIMUM_THREADS=1
os.environ["NUMEXPR_NUM_THREADS"] = "1" # export NUMEXPR_NUM_THREADS=1

import numpy as np

X, _ = load_digits(return_X_y=True)

#Copy-paste and increase the size of the dataset to see the behavior at htop.
for _ in range(8):
    X = np.vstack((X, X))

print(X.shape)
transformer = IncrementalPCA(n_components=7, batch_size=200)

transformer.partial_fit(X[:100, :])

X_transformed = transformer.fit_transform(X)

print(X_transformed.shape)

最佳答案

I am looking for a way to limit a python scripts CPU usage (not priority but the number of CPU cores) with python code.

使用 taskset 运行您的应用程序或numactl .

例如，要使您的应用程序仅使用前 4 个 CPU，请执行以下操作:

taskset --cpu-list 0-3 <app>

<小时/>

但是，这些工具限制进程使用特定的 CPU，而不是使用的 CPU 总数。为了获得最佳结果，它们要求将这些 CPU 与操作系统进程调度程序隔离，以便调度程序不会在这些 CPU 上运行任何其他进程。否则，如果指定的 CPU 当前正在运行其他线程，而其他 CPU 处于空闲状态，则您的线程将无法在其他空闲 CPU 上运行，并且必须为这些特定 CPU 排队，这是不理想的。

使用cgroups，您可以限制进程/线程使用可用CPU资源的特定部分，而不限制于特定CPU，但cgroups设置并不那么简单。

关于python - 如何限制没有终端或多处理库的 python 脚本使用的 CPU 数量？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55746872/

54

4

0

文章推荐： sql - SQL Server LEFT JOIN和WHERE子句

文章推荐： java - 谁能为我解释一下这段代码吗？

Guake 终端：一个灵感来自于 FPS 游戏的 Linux 终端
使用 Guake 终端这个可自定义且强大的适合各种用户的工具快速访问你的终端。 Guake 终端：GNOME 桌面中自上而下终端 Guake 是一款为 GNOME
python - 如何更改 Visual Studio 代码中的终端以使用非 Rosetta 终端，即让它使用 arm64 终端？
我是 python 的新手，正在尝试运行 python 2.7 script .获得了 python 2.7 的 pip 并从 mac 终端 shell 安装了 pyCrypto 的依赖项。我想尝试
swift +终端
我正在寻找一种在 Swift (macOS) 中运行终端命令的方法。我遇到了this发布，但我似乎无法获得任何解决方案。我正在尝试从我的应用程序关闭我的 mac，就像您可以从终端执行的那样(osasc
bash 终端，希望光标显示在下一行的开头
我在 macOS 上使用 bash 终端。用户名、计算机名和文件路径占据了大部分行，所以如果我写一个长命令，我会从一行开始，然后在下一行继续。相反，我希望行光标从用户名和计算机名下方的下一行开始。
perl - 终端:我在哪里？
是否有一个变量或函数可以告诉我光标的实际位置？ #!/usr/bin/env perl use warnings; use 5.012; use Term::ReadKey; use Term::Ca
gnuplot tikz 终端
如何在 Mac Os X(10.6.8) 上的 gnuplot 中启用 tikz 终端？我有工作 tikz 的 latex 。现在我从 http://www.lua.org/ 安装了 lua并下载g
macos - 终端:shell启动文件在哪里？
我正在学习一个名为 Starting a Django 1.4 Project the Right Way 的教程，其中提供了有关如何使用 virtualenv 和 virtualenvwrapper
Java Unix 终端
我正在尝试用java编写一个unix终端模拟器。我有很多麻烦。我似乎无法更改程序的工作目录，因此“cd”等命令无法正常工作。我的问题是，如果我运行一个需要用户输入的命令，有什么方法可以将该输入发送到正
终端 sudo 命令
我在这方面完全是个新手(Mac leopard 中的终端)，我希望能从网络上获得生命线，因为我确实碰壁了。我想在终端中以 root 身份运行脚本。该脚本保存为扩展名为 .rtf 的文本文件。我已经插
终端 Applescript 无法逃脱报价
尝试在我的 osascript 命令中包含引号 ' ' 时遇到了一个奇怪的问题。如果我尝试转义一个正常的可转义字符，它就可以正常工作。示例: osascript -e 'tell app "Find
java - 获取系统日志的完整输出(终端)
我正在制作一个控制台 Java 应用程序，您可以在其中输入控制台命令，例如 Macintosh/Ubuntu/Windows 命令提示符上的终端，然后将其输出到日志。我想知道，在执行系统/控制台命令
mysql - 终端，MySQL如何退出插入模式？
在终端中输入 mysql 命令并按回车键会换行。但有时当我犯错时，即使用分号结束语句也无法退出此模式。 Ctrl + c 退出mysql。我怎样才能退出插入模式？最佳答案你必须用 ';' 结束
在xeyes(终端)中永久改变中心颜色的c代码
我正在尝试编写一个 C 代码来打开 xeyes 应用程序，然后那些眼睛在特定的时间段内不断改变其颜色.. 我尝试通过执行具有一种中心颜色的 xeyes、添加 3 秒的延迟、终止进程并在循环内打开具有另
java - 在消息的同一行输入(终端)
是否有一种语法允许我在 System.out.println() 行的同一行中读取用户的输入？例子: What is your name?:(<-- Output) Jack (<-- In
bash - 递归地将嵌套文件夹内容复制到一个文件夹(终端)
我有一个 Wordpress 上传文件夹，该文件夹使用子文件夹构建了几个月。 wolfr2:uploads wolfr$ tree . . |-- 2007 | |-- 08 | | |-
ios - SQLite3 终端
如何从 mac 终端使用 sqlite3 找出表的列名？我忘记了我给这些列起的名字，我也不知道这些名字是怎么来的。谢谢! 最佳答案来自 http://www.sqlite.org/sqlite.ht
linux - 终端:发送禁止操作转义序列或控制字符
我需要我的终端发送一个未使用的控制字符或转义序列，它在所有层都没有效果：被shell（bash，…）忽略，被行编辑器（readline，…）忽略，被所有应用程序（vim，less，mutt，…）忽略。
支持全键盘的 Linux 终端？
我做了一个文本编辑器，我想把它移植到 Linux 上，这样我就可以通过 SSH 远程使用它。我不太了解 Linux 终端，所以也许我遗漏了一些明显的东西，因为我简直不敢相信在 2013 年远程终端仍然
java - 运行java类文件的简单方法(终端)
我最近想放一个 java 类文件供下载，人们可以在终端中运行它。这是一个 Minecraft 命令生成器，因此下载它的人不一定具有最大的心智能力(当然，我指的是 8 岁的 child ，他们不知道自己
c - 终端:来自文件的程序输入
我有一个文件“test.txt”，里面有一个数字列表，就像这样 1 3 4 2 3 40 312 53 243 321 423 ...etc 我还有一个可执行文件，它是一种排序算法，例如 hea

首页

博学

6Ren·AI

商城

python - 如何限制没有终端或多处理库的 python 脚本使用的 CPU 数量？