multicore - 如何控制进程运行在哪个核心上？-6ren

multicore - 如何控制进程运行在哪个核心上？

转载作者：行者123 更新时间：2023-12-03 05:48:05

29

4

我可以理解如何编写一个使用多个进程或线程的程序:fork()一个新进程并使用IPC，或者创建多个线程并使用这些类型的通信机制。

我也理解上下文切换。也就是说，操作系统只用一个CPU，为每个进程调度时间(并且有大量的调度算法)，从而实现多个进程同时运行。

现在我们有了多核处理器(或多处理器计算机)，我们可以让两个进程在两个单独的核心上同时运行。

我的问题是关于最后一个场景:内核如何控制进程在哪个核心上运行？哪些系统调用(在 Linux 中，甚至 Windows 中)在特定核心上调度进程？

我问的原因是:我正在为学校开展一个项目，我们将在其中探索计算领域的一个最新主题 - 我选择了多核架构。似乎有很多关于如何在这种环境中编程(如何观察死锁或竞争条件)的 Material ，但关于控制各个内核本身的 Material 却很少。我希望能够编写一些演示程序并呈现一些汇编指令或 C 代码，以实现“看，我在第二个核心上运行无限循环，看看 CPU 利用率的峰值”特定核心”。

有代码示例吗？或者教程？

编辑:澄清一下 - 很多人都说这是操作系统的目的，并且应该让操作系统来处理这个问题。我完全同意!但我要问(或试图了解)的是操作系统实际上做了什么来做到这一点。不是调度算法，而是更多“一旦选择了核心，必须执行哪些指令才能让该核心开始获取指令？”

最佳答案

正如其他人所提到的，处理器亲和性是特定于操作系统的。如果您想在操作系统的范围之外执行此操作，您会享受到很多乐趣，我的意思是痛苦。

也就是说，其他人提到了 SetProcessAffinityMask 对于 Win32。没有人提到 Linux 内核设置处理器关联的方法，所以我会提到。您需要使用 sched_setaffinity(2) 系统调用。这是a nice tutorial如何。

此系统调用的命令行包装器是 taskset(1) 。例如
taskset -c 2,3 perf stat awk 'BEGIN{for(i=0;i<100000000;i++){}}'限制繁忙循环的 perf-stat 在核心 2 或 3 上运行(仍然允许它在核心之间迁移，但仅限于这两个核心之间)。

关于multicore - 如何控制进程运行在哪个核心上？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/663958/

29

4

0

文章推荐： eclipse - Eclipse 中的 vim 命令

文章推荐： javascript - 需要了解如何实现它

文章推荐： Android - zipalign 在 apksigner 之前失败

c - 为什么 4 线程程序在 1 核 VM 上比在 4 核 VM 上运行得更快？
我使用 4 核 i7 CPU(8 个逻辑核)，debian linux 虚拟机也是 debian linux 程序使用 gcc 编译，没有进行特殊优化(默认编译设置) 我循环了该程序 1000 次。当
parallel-processing - 大量线程消耗对 ARM(4 核 A72)与 x86(2 核 i5)的影响
我有一个实时 linux 桌面应用程序(用 C 语言编写)，我们正在移植到 ARM(4 核 Cortex v8-A72 CPU)。在架构上，它结合了高优先级显式 pthread(其中 6 个)和一对
linux - 如何创建 Solr 6 核？
我已经在 Digital Ocean ubuntu 实例上安装了 Solr 6: install_solr_service.sh solr-6.1.0.tgz 并验证 Solr 正在运行。但是，我无法
c++ - 如何识别阻碍我的程序在 32 核 CPU 上良好扩展的瓶颈？
关闭。这个问题需要更多focused .它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 3 年前。 Improve this qu
parallel-processing - 英特尔刚刚推出了一款新的 48 核 CPU。向多核迁移对我们程序员意味着什么？
关闭。这个问题需要更多focused .它目前不接受答案。想改善这个问题吗？更新问题，使其仅关注一个问题 editing this post . 6年前关闭。 Improve this questi
image-processing - 带有卡方核的线性 svm 与 rbf 核
我有一个大约 2000 维的特征向量。都是直方图特征。我不知道在我的情况下哪个有效:将 SVM 与 RBF 核或卡方核应用？你能建议我在我的情况下有效的内核吗？最佳答案一般来说，卡方和交集内核
macos - 关闭 6 核 Intel Xeon 中的超线程
我们有一台 12 核 MacPro 来进行一些蒙特卡罗计算。其 Intel Xeon 处理器启用了超线程 (HT)，因此实际上应该有 24 个进程并行运行才能充分利用它们。然而，我们的计算在 12x1
r - 如何在 2 核 MacBook Pro 上运行多核？
所以这段代码: library(plyr) library(doMC) registerDoMC(cores=2) x=1:100 llply(x, some_function, .parallel=
performance - 在 32 核/10Gbit 主机上调优 Netty
Netty Server 流到 Netty 客户端(点对点，1 对 1): 好的案例:Server和Client都是12 cores , 1Gbit NIC => 以每秒 300K 200 字节消息
c# - 4 核 PC 上的 c# 程序中的线程激活顺序
我对以下 C# 代码的线程激活顺序感到困惑。它创建了 10 个线程，随机启动它们，每个线程模拟执行一个耗时的工作 10 次，如果你检查调试输出，线程似乎不是随机选择的，请看下面的输出示例，注意线程 #
machine-learning - 在扩展特征空间中，核 SVM 与线性 SVM 相比有哪些缺点？
这是我考试时提出的问题。我给出了以下答案，我的得分是0分。教授甚至不同意给予任何部分的认可，也没有告诉我我的答案有什么问题。谁能帮我找出我的答案有什么问题吗？这是我在考试中给出的答案。缺点是:1)
c++ - 在 24 核 CPU 中增加线程数超过 4 会导致性能下降
我有一个 Intel Xeon E5-2620，它有 24 个 CPU。我写了一个应用程序，它创建 24 个线程来使用 openssl 解密 AES。当我在 100 万数据解密时将线程数从 1 增加到
ios - quartz 核 : Changing whole layer pixels color
我正在开发一个在图层上绘画的应用程序。这是一个示例代码，展示了我的绘画方式。 UIImageView * currentLayer = // getting the right layer... UI
python - 如何将线程固定到具有预定内存池对象的内核？ (80 核 Nehalem 架构 2Tb 内存)
在带有 2Tb DRAM 的 80 核 (160HT) nehalem 架构上运行一些测试后，我遇到了一个小的 HPC 问题: 当每个线程开始请求有关“错误”套接字上的对象的信息时，具有 2 个以上套
asp.net-mvc - Azure 网站，中型实例，2 核，多少个应用程序池？
由于潜在的性能问题，我刚刚将测试实例从小型“标准”(1 核，1.75GB RAM)实例升级到中型“标准”实例(2 核，3.5GB RAM)，这似乎是快速击中。我们确实存在应用程序池回收和必须重新预热某
java - 是否有可能在 4 核 Android 设备中高效地实现并行数学计算？ (这个与接口(interface)无关)
我知道，为了在 Android 中保持响应式界面，繁重的工作必须在独立线程中完成。我很清楚如何实现这一点(通过使用 AsynTask...等)，这不是问题的重点，只是让每个人都知道。但是我已经在一个
java - 为什么我的 java 长时间运行的线程(5k+ 线程)没有利用所有机器内核(12 核)？
我写了一个简单的多线程 Java 应用程序，主要方法只创建 5k 个线程，每个线程将循环处理一个包含 5M 条记录的列表。我的机器规范: CPU 内核:12 个内核内存:13Gb RAM 操作系统
multithreading - 如何在 4 核 CPU : 4 threads or 50 threads? 上更快地进行相同的计算
让我们假设我们有固定数量的计算工作，没有阻塞、 sleep 、I/O 等待。工作可以很好地并行化——它由 100M 小而独立的计算任务组成。什么是 4 核 CPU 的速度更快 - 运行 4 个线程或
machine-learning - 使用 RBF 核 SVM 时，c 或 gamma 的高值是否会出现问题？
我正在使用 WEKA/LibSVM 来训练术语提取系统的分类器。我的数据不是线性可分的，因此我使用 RBF 内核而不是线性内核。我关注了guide from Hsu et al.并迭代 c 和 ga
Python multiprocessing.cpu_count() 在 4 核 Nvidia Jetson TK1 上返回 '1'
谁能告诉我为什么在具有四个 ARMv7 处理器的 Jetson TK1 上调用 Python 的 multiprocessing.cpu_count() 函数会返回 1？ >>> import mul

首页

博学

6Ren·AI

商城

multicore - 如何控制进程运行在哪个核心上？