- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我一直在研究 C# 和 C++ 中 SIMD 算法的优势,发现在许多情况下,在 AVX 处理器上使用 128 位寄存器比在具有 AVX2 的处理器上使用 256 位寄存器提供更好的改进,但是我不明白为什么。
我所说的改进是指在同一台机器上 SIMD 算法相对于非 SIMD 算法的加速。
最佳答案
在 AVX 处理器上,256 位寄存器的上半部分和浮点单元在不执行 AVX 指令(VEX 编码操作码)时由 CPU 关闭。当代码确实使用 AVX 指令时,CPU 必须为 FP 单元加电——这大约需要 70 微秒,在此期间,AVX 指令实际上使用 128 个微操作执行两次。
当 AVX 指令在大约 700 微秒内未被使用时,CPU 会再次关闭电路的上半部分。
现在它这样做是因为电路的上半部分消耗功率(doh!),因此会产生热量(double doh!)。这意味着当使用 AVX 指令时,CPU 会运行得更热。因此,鉴于 CPU 在具有热余量时可以“涡轮增压”,使用 AVX 指令会减少这种机会,事实上,CPU 实际上会降低“基本时钟速度”。因此,例如,如果您有一个官方时钟频率为 2.3GHz 的 CPU,可以加速到 2.7,当您开始使用 AVX 指令时,芯片的时钟频率会下降到 2.1 并仅提升到 2.3,在极端情况下,基本时钟可能减少到 1.9(参见 this 的第 2-4 页)。
在此阶段,您的 CPU 执行所有指令的速度大约比不使用 AVX 指令时慢 10-15%,甚至可能慢 20%。如果您正在执行大量 SIMD 操作,那么 256 位宽的指令就值得这样做。但是,如果您正在执行一些 AVX 指令,然后是“正常”代码,然后又是一些 AVX,那么这种时钟速度损失将比您仅从 AVX 获得的所有 yield 都要多。
这就是为什么 128 位宽的 SIMD 可以比 256 位宽的运行速度更快的原因,除非您有 SIMD 主导的操作的长时间密集突发。使用剩余的硅是有代价的……(或者更准确地说,是不使用它的奖励,我们有时会忘记我们已经得到了)。
关于c# - 为什么只有 AVX 的处理器在许多 SIMD 算法方面优于 AVX2 处理器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35663635/
我想显示一个图像(大于 iPhone 的屏幕),用户可以滚动。不难,我已经用这段代码完成了:在我的 .h 文件中 @interface mappa1 : UIViewController { IBO
bash 联机帮助页说: Redirecting Standard Output and Standard Error Bash allows both the standard output (fi
我将大量数据绑定(bind)到 TreeView 控件,因为数据是自然的类别层次结构。问题是它有很多。我已经设法通过仅绑定(bind)那些出现在可见树中的节点来消除大量开销,但这仍然在 ViewSta
我正在尝试为 mysql 操作与 redis 操作制作基准测试脚本。 这是我尝试过的: 1./ List of comment ids with a separate hash of comment
我很想知道是否有比 FileObserver 更好的方法来监视目录的文件更改/创建/删除。 FileObserver 需要持续引用它,这需要持续运行的服务,这很困难,也是一种不好的做法,对吧? 对于如
我创建了一个带有 NSOpenGLView 的窗口,我正在将 openGL 内容渲染到其中。 我想向 View 添加一些按钮和文本字段:我可以使用界面生成器(或代码)添加 NSTextFields 和
如何编码 JAXBElement 列表? 例如,我有一个无法注释的 POJO: public class APojo { private String aString; public APojo()
我正在开发一个博客,我的客户希望在其中使用大量图像(文章、标题、广告等)。他几乎不想要任何文本,因为他希望用阿拉伯语开发博客并且他对网络浏览器支持的任何字体都不满意,他也不想采用 EOT,他将每天更新
我想在文本字段上添加一个标签,该标签会在用户键入时发生变化。问题是文本字段的插入符号位于标签后面(如果我将标签放在文本字段前面)。我始终可以使文本字段的背景透明,并在标签和文本字段后面添加另一个禁用的
我正在尝试在 iOS 应用程序中创建一个特定的布局,其中“背景”是一个 MKMapView,覆盖层是一个 UIScrollView。这个想法是有两个屏幕,一个带有 map ,另一个带有一些附加信息。用
我需要在 UITableViewController 上放置一个 UIView,目前我是这样放置的 [self.navigationController.view addSubview:searchV
我有一个非常简单的问题要问:我需要在屏幕右下角的 ImageView 上放一个小 Logo ,整个屏幕都很大,但我不知道如何设置坐标或如何设置说 ImageViews 处于相对位置。 像这样: 最佳答
我试图让 mapView 覆盖整个 UITableViewCell 并禁用此 mapView 上的所有用户事件,但仍然可以单击单元格。但是,此 mapView(即使我将 subview 发送回)正在拦
我们即将获得 Java EE6(使用 Glassfish v3 作为引用实现)。计划发布时间为 12 月 9 日。虽然仍有相当多的公司正在努力将他们的代码库从早期版本迁移到 EE5,但我们处于开始开发
为什么(在 WPF、C#、 Entity Framework 中)将 ListBox 绑定(bind)到在 ObjectSet 上创建的 ObservableCollection(来自 Entity框
在 hibernate 中使用 @NamedQuery 而不是 @NamedNativeQuery 有什么好处,反之亦然。我无法发现确切的区别或在什么情况下我们应该使用 @NamedQuery 而不是
在 Dart 中,检查值是否为 == null似乎类似于检查它是否is Null .为什么前者更可取? 最佳答案 这是您正在进行的比较类型。在 == null ,您正在将对象/原始对象与 null 进
我使用的是 Java 1.6。我有一组项目,每个项目都有一个名称和一组组件。每个组件也有一个名称。 Set Class Item String name Set Class Compo
如果我想在我的应用程序中支持脚本,是否 scriptcs提供比仅使用普通 Vanilla 的任何特殊优势 Roslyn脚本引擎? 最佳答案 不幸的是,目前还没有太多关于托管 scriptcs 的文档,
我正在我的应用程序中使用 Struts 和 Spring jdbc 模板。 我必须在我们的代码中使用 Hibernate 模板。 谁能告诉我为什么要使用 Hibernate 模板? 使用 Spring
我是一名优秀的程序员,十分优秀!