c# - 为什么只有 AVX 的处理器在许多 SIMD 算法方面优于 AVX2 处理器？-6ren

c# - 为什么只有 AVX 的处理器在许多 SIMD 算法方面优于 AVX2 处理器？

转载作者：塔克拉玛干更新时间：2023-11-03 00:04:02

25

4

我一直在研究 C# 和 C++ 中 SIMD 算法的优势，发现在许多情况下，在 AVX 处理器上使用 128 位寄存器比在具有 AVX2 的处理器上使用 256 位寄存器提供更好的改进，但是我不明白为什么。

我所说的改进是指在同一台机器上 SIMD 算法相对于非 SIMD 算法的加速。

最佳答案

在 AVX 处理器上，256 位寄存器的上半部分和浮点单元在不执行 AVX 指令(VEX 编码操作码)时由 CPU 关闭。当代码确实使用 AVX 指令时，CPU 必须为 FP 单元加电——这大约需要 70 微秒，在此期间，AVX 指令实际上使用 128 个微操作执行两次。

当 AVX 指令在大约 700 微秒内未被使用时，CPU 会再次关闭电路的上半部分。

现在它这样做是因为电路的上半部分消耗功率(doh!)，因此会产生热量(double doh!)。这意味着当使用 AVX 指令时，CPU 会运行得更热。因此，鉴于 CPU 在具有热余量时可以“涡轮增压”，使用 AVX 指令会减少这种机会，事实上，CPU 实际上会降低“基本时钟速度”。因此，例如，如果您有一个官方时钟频率为 2.3GHz 的 CPU，可以加速到 2.7，当您开始使用 AVX 指令时，芯片的时钟频率会下降到 2.1 并仅提升到 2.3，在极端情况下，基本时钟可能减少到 1.9(参见 this 的第 2-4 页)。

在此阶段，您的 CPU 执行所有指令的速度大约比不使用 AVX 指令时慢 10-15%，甚至可能慢 20%。如果您正在执行大量 SIMD 操作，那么 256 位宽的指令就值得这样做。但是，如果您正在执行一些 AVX 指令，然后是“正常”代码，然后又是一些 AVX，那么这种时钟速度损失将比您仅从 AVX 获得的所有 yield 都要多。

这就是为什么 128 位宽的 SIMD 可以比 256 位宽的运行速度更快的原因，除非您有 SIMD 主导的操作的长时间密集突发。使用剩余的硅是有代价的……(或者更准确地说，是不使用它的奖励，我们有时会忘记我们已经得到了)。

关于c# - 为什么只有 AVX 的处理器在许多 SIMD 算法方面优于 AVX2 处理器？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35663635/

25

4

0

文章推荐： linux - 正确分配堆栈以克隆线程

文章推荐： android - 我应该删除 GCM 的 SNS 端点吗？

文章推荐： python - 登录到远程机器并运行脚本

文章推荐： android - Facebook SDK "Package bolts does not exist error"安卓工作室

iphone - UIButton 优于 UIImageView(优于 UIScrollView)
我想显示一个图像(大于 iPhone 的屏幕)，用户可以滚动。不难，我已经用这段代码完成了:在我的 .h 文件中 @interface mappa1 : UIViewController { IBO
bash - 为什么 &> 优于 >&？
bash 联机帮助页说: Redirecting Standard Output and Standard Error Bash allows both the standard output (fi
c# - 优于 TreeView
我将大量数据绑定(bind)到 TreeView 控件，因为数据是自然的类别层次结构。问题是它有很多。我已经设法通过仅绑定(bind)那些出现在可见树中的节点来消除大量开销，但这仍然在 ViewSta
MySQL 优于 Redis
我正在尝试为 mysql 操作与 redis 操作制作基准测试脚本。这是我尝试过的: 1./ List of comment ids with a separate hash of comment
android - 优于 FileObserver
我很想知道是否有比 FileObserver 更好的方法来监视目录的文件更改/创建/删除。 FileObserver 需要持续引用它，这需要持续运行的服务，这很困难，也是一种不好的做法，对吧？对于如
cocoa - NSTextField 优于 NSOpenGLView
我创建了一个带有 NSOpenGLView 的窗口，我正在将 openGL 内容渲染到其中。我想向 View 添加一些按钮和文本字段:我可以使用界面生成器(或代码)添加 NSTextFields 和
java - JAXBElement 优于 ArrayList？
如何编码 JAXBElement 列表？例如，我有一个无法注释的 POJO: public class APojo { private String aString; public APojo()
php - BLOB 优于 varchar？
我正在开发一个博客，我的客户希望在其中使用大量图像(文章、标题、广告等)。他几乎不想要任何文本，因为他希望用阿拉伯语开发博客并且他对网络浏览器支持的任何字体都不满意，他也不想采用 EOT，他将每天更新
iOS uilabel 优于 uitextfield
我想在文本字段上添加一个标签，该标签会在用户键入时发生变化。问题是文本字段的插入符号位于标签后面(如果我将标签放在文本字段前面)。我始终可以使文本字段的背景透明，并在标签和文本字段后面添加另一个禁用的
ios - UIScrollView 优于 MKMapView
我正在尝试在 iOS 应用程序中创建一个特定的布局，其中“背景”是一个 MKMapView，覆盖层是一个 UIScrollView。这个想法是有两个屏幕，一个带有 map ，另一个带有一些附加信息。用
ios - UIView 优于 UITableViewController
我需要在 UITableViewController 上放置一个 UIView，目前我是这样放置的 [self.navigationController.view addSubview:searchV
Android，ImageView 优于 ImageView
我有一个非常简单的问题要问:我需要在屏幕右下角的 ImageView 上放一个小 Logo ，整个屏幕都很大，但我不知道如何设置坐标或如何设置说 ImageViews 处于相对位置。像这样: 最佳答
swift - MapView 优于 UITableViewCell
我试图让 mapView 覆盖整个 UITableViewCell 并禁用此 mapView 上的所有用户事件，但仍然可以单击单元格。但是，此 mapView(即使我将 subview 发送回)正在拦
Java EE6 优于 EE5？
我们即将获得 Java EE6(使用 Glassfish v3 作为引用实现)。计划发布时间为 12 月 9 日。虽然仍有相当多的公司正在努力将他们的代码库从早期版本迁移到 EE5，但我们处于开始开发
c# - ObservableCollection 优于 ObjectSet
为什么(在 WPF、C#、 Entity Framework 中)将 ListBox 绑定(bind)到在 ObjectSet 上创建的 ObservableCollection(来自 Entity框
java - @NamedQuery 优于 @NamedNativeQuery
在 hibernate 中使用 @NamedQuery 而不是 @NamedNativeQuery 有什么好处，反之亦然。我无法发现确切的区别或在什么情况下我们应该使用 @NamedQuery 而不是
dart - 为什么 `== null` 优于 `is Null` ？
在 Dart 中，检查值是否为 == null似乎类似于检查它是否is Null .为什么前者更可取？最佳答案这是您正在进行的比较类型。在 == null ，您正在将对象/原始对象与 null 进
java - 优于 O(n²) 复杂度的列表中列表的查找算法
我使用的是 Java 1.6。我有一组项目，每个项目都有一个名称和一组组件。每个组件也有一个名称。 Set Class Item String name Set Class Compo
roslyn - scriptcs 托管 - 优于 Roslyn
如果我想在我的应用程序中支持脚本，是否 scriptcs提供比仅使用普通 Vanilla 的任何特殊优势 Roslyn脚本引擎？最佳答案不幸的是，目前还没有太多关于托管 scriptcs 的文档，
java - spring jdbc 优于 hibernate
我正在我的应用程序中使用 Struts 和 Spring jdbc 模板。我必须在我们的代码中使用 Hibernate 模板。谁能告诉我为什么要使用 Hibernate 模板？使用 Spring

首页

博学

6Ren·AI

商城

c# - 为什么只有 AVX 的处理器在许多 SIMD 算法方面优于 AVX2 处理器？