- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我可以理解如何编写一个使用多个进程或线程的程序:fork()一个新进程并使用IPC,或者创建多个线程并使用这些类型的通信机制。
我也理解上下文切换。也就是说,操作系统只用一个CPU,为每个进程调度时间(并且有大量的调度算法),从而实现多个进程同时运行。
现在我们有了多核处理器(或多处理器计算机),我们可以让两个进程在两个单独的核心上同时运行。
我的问题是关于最后一个场景:内核如何控制进程在哪个核心上运行?哪些系统调用(在 Linux 中,甚至 Windows 中)在特定核心上调度进程?
我问的原因是:我正在为学校开展一个项目,我们将在其中探索计算领域的一个最新主题 - 我选择了多核架构。似乎有很多关于如何在这种环境中编程(如何观察死锁或竞争条件)的 Material ,但关于控制各个内核本身的 Material 却很少。我希望能够编写一些演示程序并呈现一些汇编指令或 C 代码,以实现“看,我在第二个核心上运行无限循环,看看 CPU 利用率的峰值”特定核心”。
有代码示例吗?或者教程?
编辑:澄清一下 - 很多人都说这是操作系统的目的,并且应该让操作系统来处理这个问题。我完全同意!但我要问(或试图了解)的是操作系统实际上做了什么来做到这一点。不是调度算法,而是更多“一旦选择了核心,必须执行哪些指令才能让该核心开始获取指令?”
最佳答案
正如其他人所提到的,处理器亲和性是特定于操作系统的。如果您想在操作系统的范围之外执行此操作,您会享受到很多乐趣,我的意思是痛苦。
也就是说,其他人提到了 SetProcessAffinityMask
对于 Win32。没有人提到 Linux 内核设置处理器关联的方法,所以我会提到。您需要使用 sched_setaffinity(2)
系统调用。这是a nice tutorial如何。
此系统调用的命令行包装器是 taskset(1)
。例如
taskset -c 2,3 perf stat awk 'BEGIN{for(i=0;i<100000000;i++){}}'
限制繁忙循环的 perf-stat 在核心 2 或 3 上运行(仍然允许它在核心之间迁移,但仅限于这两个核心之间)。
关于multicore - 如何控制进程运行在哪个核心上?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/663958/
我使用 4 核 i7 CPU(8 个逻辑核),debian linux 虚拟机也是 debian linux 程序使用 gcc 编译,没有进行特殊优化(默认编译设置) 我循环了该程序 1000 次。当
我有一个实时 linux 桌面应用程序(用 C 语言编写),我们正在移植到 ARM(4 核 Cortex v8-A72 CPU)。在架构上,它结合了高优先级显式 pthread(其中 6 个)和一对
我已经在 Digital Ocean ubuntu 实例上安装了 Solr 6: install_solr_service.sh solr-6.1.0.tgz 并验证 Solr 正在运行。但是,我无法
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 3 年前。 Improve this qu
关闭。这个问题需要更多focused .它目前不接受答案。 想改善这个问题吗?更新问题,使其仅关注一个问题 editing this post . 6年前关闭。 Improve this questi
我有一个大约 2000 维的特征向量。都是直方图特征。 我不知道在我的情况下哪个有效:将 SVM 与 RBF 核或卡方核应用? 你能建议我在我的情况下有效的内核吗? 最佳答案 一般来说,卡方和交集内核
我们有一台 12 核 MacPro 来进行一些蒙特卡罗计算。其 Intel Xeon 处理器启用了超线程 (HT),因此实际上应该有 24 个进程并行运行才能充分利用它们。然而,我们的计算在 12x1
所以这段代码: library(plyr) library(doMC) registerDoMC(cores=2) x=1:100 llply(x, some_function, .parallel=
Netty Server 流到 Netty 客户端(点对点,1 对 1): 好的 案例:Server和Client都是12 cores , 1Gbit NIC => 以每秒 300K 200 字节消息
我对以下 C# 代码的线程激活顺序感到困惑。它创建了 10 个线程,随机启动它们,每个线程模拟执行一个耗时的工作 10 次,如果你检查调试输出,线程似乎不是随机选择的,请看下面的输出示例,注意线程 #
这是我考试时提出的问题。我给出了以下答案,我的得分是0分。教授甚至不同意给予任何部分的认可,也没有告诉我我的答案有什么问题。谁能帮我找出我的答案有什么问题吗? 这是我在考试中给出的答案。缺点是:1)
我有一个 Intel Xeon E5-2620,它有 24 个 CPU。我写了一个应用程序,它创建 24 个线程来使用 openssl 解密 AES。当我在 100 万数据解密时将线程数从 1 增加到
我正在开发一个在图层上绘画的应用程序。这是一个示例代码,展示了我的绘画方式。 UIImageView * currentLayer = // getting the right layer... UI
在带有 2Tb DRAM 的 80 核 (160HT) nehalem 架构上运行一些测试后,我遇到了一个小的 HPC 问题: 当每个线程开始请求有关“错误”套接字上的对象的信息时,具有 2 个以上套
由于潜在的性能问题,我刚刚将测试实例从小型“标准”(1 核,1.75GB RAM)实例升级到中型“标准”实例(2 核,3.5GB RAM),这似乎是快速击中。我们确实存在应用程序池回收和必须重新预热某
我知道,为了在 Android 中保持响应式界面,繁重的工作必须在独立线程中完成。我很清楚如何实现这一点(通过使用 AsynTask...等),这不是问题的重点,只是让每个人都知道。 但是我已经在一个
我写了一个简单的多线程 Java 应用程序,主要方法只创建 5k 个线程,每个线程将循环处理一个包含 5M 条记录的列表。 我的机器规范: CPU 内核:12 个内核 内存:13Gb RAM 操作系统
让我们假设我们有固定数量的计算工作,没有阻塞、 sleep 、I/O 等待。工作可以很好地并行化——它由 100M 小而独立的计算任务组成。 什么是 4 核 CPU 的速度更快 - 运行 4 个线程或
我正在使用 WEKA/LibSVM 来训练术语提取系统的分类器。我的数据不是线性可分的,因此我使用 RBF 内核而不是线性内核。 我关注了guide from Hsu et al.并迭代 c 和 ga
谁能告诉我为什么在具有四个 ARMv7 处理器的 Jetson TK1 上调用 Python 的 multiprocessing.cpu_count() 函数会返回 1? >>> import mul
我是一名优秀的程序员,十分优秀!