hyperthreading - 在支持超线程的四核 CPU 上运行的单 CPU 程序-6ren

hyperthreading - 在支持超线程的四核 CPU 上运行的单 CPU 程序

转载作者：行者123 更新时间：2023-12-03 23:30:32

26

4

我是一名统计模式识别的研究人员，我经常运行运行很多天的模拟。我正在运行带有 Linux 3.2.0-24-generic 的 Ubuntu 12.04，据我所知，它支持多核和超线程。使用带 HTT 的 Intel Core i7 Sandy Bridge Quadcore，我经常同时运行 4 个模拟(需要很长时间的程序)。在我提出问题之前，以下是我已经(认为我)知道的事情。

由于超线程，我的操作系统 (Ubuntu 12.04) 检测到 8 个 CPU。

我的操作系统中的调度程序足够聪明，永远不会调度两个程序在属于同一物理内核的两个逻辑(虚拟)内核上运行，因为操作系统支持 SMP(同步多线程)。

我已阅读有关超线程的维基百科页面。

我已阅读 Sandy Bridge 上的 HowStuffWorks 页面。

好的，我的问题如下。当我在我的计算机上同时运行 4 个模拟(程序)时，它们每个都在一个单独的物理内核上运行。但是，由于超线程，每个物理内核被拆分为两个逻辑内核。因此，每个物理内核仅使用其全部容量的一半来运行我的每个模拟是真的吗？

非常感谢您提前。如果我的问题的任何部分不清楚，请告诉我。

最佳答案

这个答案可能晚了，但我看到没有人准确描述幕后发生的事情。

要回答您的问题，不，一个线程不会使用半个内核。
一个线程一次可以在内核内部工作，但是一个线程可以使整个内核的处理能力饱和。

假设线程 1 和线程 2 属于核心 #0。线程 1 可以使整个内核的处理能力饱和，而线程 2 则等待另一个线程结束其执行。这是一个串行执行，而不是并行执行。

乍一看，那额外的线程似乎没有用。我的意思是核心可以一次处理 1 个线程，对吗？

正确，但在某些情况下，由于 2 个重要因素，内核实际上处于空闲状态:

缓存未命中

分支预测错误

缓存未命中

当它接收到一个任务时，CPU 在它自己的缓存中搜索它需要使用的内存地址。在许多情况下，内存数据非常分散，以至于在物理上不可能将所有必需的地址范围保存在缓存中(因为缓存的容量确实有限)。

当 CPU 在缓存中找不到它需要的东西时，它必须访问 RAM。 RAM 本身速度很快，但与 CPU 的片上缓存相比，它显得苍白无力。 RAM 的延迟是这里的主要问题。

在访问 RAM 时，内核停止。它什么都不做。这并不明显，因为无论如何所有这些组件都以荒谬的速度工作，并且您不会通过某些 CPU 负载软件注意到它，但它会叠加。一个接一个的缓存未命中，另一个非常明显地阻碍了整体性能。
这是第二个线程发挥作用的地方。当内核停止等待数据时，第二个线程进入以保持内核忙碌。因此，您基本上否定了核心停顿对性能的影响。

我之所以这么说，主要是因为如果发生另一次缓存未命中，第二个线程也可以停止内核，但是 2 个线程而不是 1 个线程连续丢失缓存的可能性要低得多。

分支预测错误

分支预测是指您的代码路径具有多个可能的结果。最基本的分支代码是 if陈述。
现代 CPU 的微代码中嵌入了分支预测算法，这些算法试图预测一段代码的执行路径。这些预测器实际上非常复杂，虽然我没有关于预测率的可靠数据，但我确实记得前一段时间读过一些文章，指出英特尔的 Sandy Bridge 架构的平均成功分支预测率超过 90%。

当 CPU 遇到一段分支代码时，它实际上会选择一条路径(预测器认为正确的路径)并执行它。同时，核心的另一部分评估分支表达式以查看分支预测器是否确实正确。这称为投机执行。
这类似于 2 个不同的线程:一个评估表达式，另一个提前执行可能的路径之一。

从这里我们有两种可能的情况:

预测是正确的。执行通常从在决定代码路径时已经被执行的推测分支继续。

预言家错了。处理错误分支的整个管道必须刷新并从正确的分支重新开始。
或者，当由错误预测引起的困惑得到解决时，随时可用的线程可以进入并简单地执行。这是超线程的第二次使用。
平均而言，分支预测可以大大加快执行速度，因为它具有非常高的成功率。但是当预测错误时，性能确实会受到相当大的影响。

分支预测不是性能下降的主要因素，因为正如我所说，正确预测率非常高。
但是缓存未命中是一个问题，并且在某些情况下仍将是一个问题。

根据我的经验，超线程确实对 3D 渲染有很大帮助(我将其作为业余爱好)。我注意到了 20-30% 的改进，具体取决于场景的大小和所需的 Material /纹理。巨大的场景使用大量的 RAM，这使得缓存未命中的可能性更大。超线程在克服这些失误方面有很大帮助。

关于hyperthreading - 在支持超线程的四核 CPU 上运行的单 CPU 程序，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/10709442/

26

4

0

文章推荐： qt - wkhtmltopdf 修补了qt？

文章推荐： tmux - Mosh 登录自动重新附加 tmux session

css - 如何在CSS中用一种颜色绘制一半对 Angular 线，用另一种颜色绘制另一半对 Angular 线
我将 Bootstrap 与 css 和 java 脚本结合使用。在不影响前端代码的情况下，我真的很难在css中绘制这个背景。在许多问题中，人们将宽度和高度设置为 0%。但是由于我的导航栏，我不能使用
c - scanf ("%79[^\n]",line); 之间的区别vs scanf ("%79[^\n]\n"，线) vs scanf ("%79[^\n]s"，线)
我正在用 c 编写一个程序来读取文件的内容。代码如下: #include void main() { char line[90]; while(scanf("%79[^\
Javascript获取矩阵数组的对 Angular 线
我想使用 javascript 获取矩阵数组的所有对 Angular 线。假设输入输出如下: input = [ [1,2,3], [4,5,6], [7,8,9], ] output =
pdfmake - 线，圆和其他形状？
可以用pdfmake绘制lines，circles和other shapes吗？如果是，是否有documentation或样本？我想用jsPDF替换pdfmake。最佳答案是的，有可能。 pdfm
svg - 如何制作带有边框的SVG“线”？
我有一个小svg小部件，其目的是显示角度列表（参见图片）。现在，角度是线元素，仅具有笔触，没有填充。但是现在我想使用一种“内部填充”颜色和一种“笔触/边框”颜色。我猜想line元素不能解决这个问题，
java - 线-三角形交点检查返回错误的交点
我正在为带有三角对象的 3D 场景编写一个非常基本的光线转换器，一切都工作正常，直到我决定尝试从场景原点 (0/0/0) 以外的点转换光线。但是，当我将光线原点更改为 (0/1/0) 时，相交测试突
Python Shebang 线
这个问题已经有答案了: Why do people write "#!/usr/bin/env python" on the first line of a Python script? (22 个回
java - 如何在屏幕上绘制星号(*)线？
如何使用大约 50 个星号 * 并使用 for 循环绘制一条水平线？当我尝试这样做时，结果是垂直(而不是水平)列出 50 个星号。 public void drawAstline() { f
java - 球不动；线？
这是一个让球以对角线方式下降的 UI，但球保持静止；线程似乎无法正常工作。你能告诉我如何让球移动吗？请下载一个球并更改目录，以便程序可以找到您的球的分配位置。没有必要下载足球场，但如果您愿意，也可以
ant - Jmeter和Ant报90%线
我在我的一个项目中使用 Jmeter 和 Ant，当我们生成报告时，它会在报告中显示 URL、#Samples、失败、成功率、平均时间、最短时间、最长时间。我也想在报告中包含 90% 的时间线。现
Java Swing 线
我有一个不寻常的问题，希望有人能帮助我。我想用 Canvas (android) 画一条 Swing 或波浪线，但我不知道该怎么做。它将成为蝌蚪的尾部，所以理想情况下我希望它的形状更像三角形，一端更大
javafx粗笔画路径(线)与圆之间的碰撞问题
这个问题已经有答案了: Checking Collision of Shapes with JavaFX (1 个回答) 已关闭 8 年前。我正在使用 JavaFx 8 库。我的任务很简单:我想检
bash - 如何按编号的百分比拆分文件。线？
如何按编号的百分比拆分文件。行数？假设我想将我的文件分成 3 个部分(60%/20%/20% 部分)，我可以手动执行此操作，-_-: $ wc -l brown.txt 57339 brown.tx
圆圈之间的 HTML 线
我正在努力实现这样的目标: 但这就是我设法做到的。你能帮我实现预期的结果吗？更新: 如果我删除 bootstrap.css 依赖项，问题就会消失。我怎样才能让它与 Bootstrap 一起工作？
css - 转换比例导致间隙/线
我目前正在构建一个网站，但遇到了 transform: scale 的问题。我有一个按钮，当用户将鼠标悬停在它上面时，会发生两件事: 背景以对 Angular 线“扫过” 按钮标签颜色改变按钮稍微变
macos - 非常快速地绘制图形(线)
我需要使用直线和仿射变换绘制大量数据点的图形(缩放图形以适合 View )。目前，我正在使用 NSBezierPath，但我认为它效率很低(因为点在绘制之前被复制到贝塞尔路径)。通过将我的数据切割成
image - 从车牌上删除多余的像素/线
我正在使用基于 SVM 分类的 HOG 特征检测器。我可以成功提取车牌，但提取的车牌除了车牌号外还有一些不必要的像素/线。我的图像处理流程如下: 在灰度图像上应用 HOG 检测器裁剪检测到的区域调
python - 间隙填充轮廓/线
我有以下图片: 我想填充它的轮廓(即我想在这张图片中填充线条)。我尝试了形态学闭合，但使用大小为 3x3 的矩形内核和 10 迭代并没有填满整个边界。我还尝试了一个 21x21 内核和 1 迭代，但
algorithm - 统计两组序列的交点(线)
我必须找到一种算法，可以找到两组数组之间的交集总数，而其中一个数组已排序。举个例子，我们有这两个数组，我们向相应的数字画直线。这两个数组为我们提供了总共 7 个交集。有什么样的算法可以帮助我解决
c++ - 如何从带有透视投影的近裁剪平面绘制射线/线？
简单地说 - 我想使用透视投影从近裁剪平面绘制一条射线/线到远裁剪平面。我有我认为是使用各种 OpenGL/图形编程指南中描述的方法通过单击鼠标生成的正确标准化的世界坐标。我遇到的问题是我的光线似乎

首页

博学

6Ren·AI

商城

hyperthreading - 在支持超线程的四核 CPU 上运行的单 CPU 程序