- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想我应该熟悉x86 SIMD扩展。但是在我开始之前,我就遇到了麻烦。我无法很好地了解其中哪些仍然相关。
数十年来,x86架构积累了许多数学/多媒体扩展:
最佳答案
我最近更新了SSE,AVX和x86(和SSE2,avx2)的标记Wiki。他们涵盖了很多。 tl; dr摘要:AVX汇总所有以前的SSE版本,并提供这些指令的3操作数版本。也是大多数FP(AVX)和int(AVX2)insns的256b版本。
有关各种SSE版本的摘要,请参见Wikipedia或knm241的更详细的答案。
我们真的不认为这会使SSE过时。更像是将AVX视为相同的旧SSE指令的新版本和更好的版本。它们仍以其非AVX名称(例如PSHUFB
,而不是VPSHUFB
)存在于引用手册中。您可以混合使用AVX和SSE代码,只要在需要时使用VZEROUPPER
即可避免将VEX与non-AVX混合使用而导致性能问题-VEX insns(在Intel上)。因此,您不得不调用可能运行非VEX SSE指令的库,或者您的代码使用SSE FP数学,但是只有在CPU支持的情况下才能运行某些AVX代码,这使您有些烦恼。
如果CPU兼容性不是问题,那么 vector 指令的旧版SSE版本将真正过时,就像现在的MMX一样。如果将VEX编码的128b版本算作AVX(而不是SSE),AVX / AVX2的各个方面都至少要好一些。有时您仍然会使用128b寄存器,因为您的数据仅以大块的形式出现,但是更经常地使用256b寄存器来一次执行相同运算的数据量是原来的两倍。
SSE / AVX / x87-FP /整数指令都使用相同的执行端口。通过混合它们,您无法并行完成更多工作。 (在Haswell上除外,在Haswell上4个ALU端口之一只能处理非 vector insns,如GP reg ops和branch)。
关于x86 - 不同的mmx,sse和avx版本是相互补充还是超集?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31490853/
在C#中,我可以通过base关键字访问基类,在java中,我可以通过super关键字访问它。在delphi中如何做到这一点?假设我有以下代码: type TForm3 = class(TF
在这件事上我已经把头撞到墙上好几次了。所以我希望在正确的方向上得到一点帮助。 我有一张 table ,上面有订单,一张 table 上有火车,一张 table 上有航类,一张 table 上有巴士。每
在 Python 中,假设我有以下代码: class SuperClass(object): def __init__(self, x): self.x = x
我希望这个 subview 扩展到它的父 View 之外,但是父 View 的边框正在切入 subview 。有没有办法防止这种情况? class TheView : UIView { let
我有一个标准的高斯函数,看起来像这样: def gauss_fnc(x, amp, cen, sigma): return amp * np.exp(-(x - cen) ** 2 / (2
例如,我有下一个类,带有有界类型参数: public class ItemContainer { void addItems(List items); } 在另一个带有参数的类中使用: pub
如何将此设置转换为命令? 结果如下: // Manual Compression (see the image above) Compressed Size: 12,647,451 bytes //
请建议在应用继承时如何使用@Wither/@With。 我有一个抽象类Parent和具体的Child。 Child 应该是不可变的。将 @Wither 放在两者上会给我两个错误: 构造函数 Child
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎不是关于 a specific programming problem, a softwar
我正在尝试向服务器(虚拟托管)发出 HTTP2 请求,该服务器根据主机 header 值 (SNI) 提供 SSL 证书。 # conn = hyper.HTTP20Connection('h
我有一个应用程序,必须将大约 1300 万行、大约 10 个平均长度的字符串插入到嵌入式 HSQLDB 中。我一直在调整一些东西(批量大小、单线程/多线程、缓存/非缓存表、MVCC 事务、log_si
我想定义一个函数f(x, t::Type)根据 isa(x, t) 是否执行不同的行为.假设我想调用b1(x)如果是,b2(x)除此以外。 我知道我可以像这样在运行时进行动态检查: function
我正在使用 Hyper-V WMI Provider在 Hyper-V 中导入虚拟机,特别是使用 ImportVirtualSystemEx Msvm_VirtualSystemManagementS
这几个星期以来一直困扰着我,我没有结束对它的研究,因为我目前重载并且它让我落后于第一年的 CS (opengl) 大学类(class),这首先让我研究了这个:如何只用一个 for 循环绘制立方体的所有
我正在我的计算机(操作系统:Windows 8)上开发一个 WP8 应用程序。我需要安装一个 VM 才能拥有 linux。同时我需要使用我的 Windows Phone 模拟器。 我下载了 VMWar
我是一名优秀的程序员,十分优秀!