- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我读了这个 article .它谈到了为什么AVX-512指令:
Intel’s latest processors have advanced instructions (AVX-512) that may cause the core, or maybe the rest of the CPU to run slower because of how much power they use.
vmovapd
、
vmulpd
、
vaddpd
、
vsubpd
、
vfmadd213pd
)?
最佳答案
频率影响取决于指令的宽度和 使用的指令。
共有三个频率级别,即所谓的许可证,从最快到最慢:L0、L1 和 L2。 L0 是您会在包装盒上看到的“标称”速度:当芯片显示“3.5 GHz turbo”时,它们指的是单核 L0 turbo。 L1 是较低的速度,有时称为 AVX turbo 或 AVX2 turbo5,最初与 AVX 和 AVX2 指令相关联。 L2 的速度低于 L1,有时称为“AVX-512 涡轮增压”。
每个许可证的确切速度还取决于事件内核的数量。最新的表格,通常可以咨询WikiChip .例如,Xeon Gold 5120 的表是 here :
Normal、AVX2 和 AVX512 行分别对应 L0、L1 和 L2 许可证。请注意,随着内核数量的增加,L1 和 L2 许可证的相对减速通常会变得更糟:对于 1 或 2 个事件内核,L1 和 L2 速度分别是 L0 的 97% 和 91%,但对于 13 或 14 个内核,它们是 85%和 62%。这因芯片而异,但总体趋势通常是相同的。
那些预备工作,让我们来看看我认为你在问什么:哪些指令会导致哪些许可证被激活?
这是一个表格,显示了基于指令宽度和轻重分类的隐含许可:
Width Light Heavy
--------- ------- -------
Scalar L0 N/A
128-bit L0 L0
256-bit L0 L1*
512-bit L1 L2*
*soft transition (see below)
ps
或
pd
结尾的指令,例如
addpd
)以及主要以
vpmul
开头的整数乘法指令或
vpmad
因为 SIMD 整数乘法实际上在 SIMD 单元上运行,以及
vplzcnt(q|d)
它显然也在 FMA 单元上运行。
L1*
.这是因为这些指令在发生时会导致软转换。另一个 L1 条目(用于 512 位轻型指令)导致硬转换。在这里,我们将讨论这两种转换类型。
-march
时,编译器已经大量插入 256 位指令。选项,特别是对于数据移动和自动矢量化循环。
关于optimization - SIMD 指令降低 CPU 频率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56852812/
我在堆栈上创建了这段代码: function increase_brightness(hex, percent){ var r = parseInt(hex.substr(1, 2), 16)
为什么我能够LOWER COALESCE 中的每个项目,但无法LOWER整个COALESCE,否则我会遇到语法错误?例如: SELECT COALESCE(LOWER(google_provider_
我在谷歌上搜索到的所有内容都表明,以下任何一项都会将 double 舍入到小数点后两位。 double roundToFourDecimals(double d) { DecimalForma
我正在开发一个 flexdashboard/storyboard,我想在其中降低每个帧的高度。那可能吗? 示例代码: --- title: "Flex" output: flexdashboard
我在 WPF 中有一个图像控件。我需要减小图像尺寸控件的宽度和高度。但是当我这样做时,图像看起来不太好。数据丢失更多。 所以我想降低图像分辨率而不是仅仅改变图像控件的宽度和高度。 任何人都可以帮助我如
关闭。这个问题需要details or clarity .它目前不接受答案。 想改进这个问题?通过 editing this post 添加详细信息并澄清问题. 1年前关闭。 Improve this
我正在扩展 Fluent NHibernate,以便更好地与 F# 一起使用(即引用支持),并希望获得一些关于降低 API 流畅性的反馈。 F# 要求使用返回值,除非它们是单位类型。所以这最终以“|>
我们有一个 BizTalk 2010 接收位置,它将获取一个 70MB 的文件,然后使用入站映射(在接收位置)和出站映射(在发送端口)生成一个 1GB 文件。 执行上述过程时,SQL Server 会
我的代码分析插件提示包含以下代码的方法中的代码复杂性。我注意到以下代码看起来可以组合,但我不知道如何做到这一点: for(Command command : commands) { if (c
我正在寻找一种方法来始终忽略 R 中 float 之间的微小差异(根据 IEC 60559,这些是 double 浮点),通过使用基本 R 工具而不诉诸 C 或 C++。换句话说,我想“四舍五入” d
在 Blazor 中使用 ChartJs.Blazor 的 BarChart 组件时是否可以降低甚至关闭动画速度?我发现这个 NuGet 包非常有用,但我不知道如何在更新条形图时关闭动画。为了更容易忽
所以我为一个游戏编写了这段代码,现在该游戏的速度非常快。我想降低 FPS,让游戏慢一点。 我认为我唯一的出路就是制作一个计时器。但我发现很难找到放置计时器的位置?谁能帮我解决这个问题吗? 所以我为一个
我正在编写一个程序,我担心它运行所需的时间和所占用的空间。 在程序中我使用了一个变量来存储数组的长度: int len=newarray3.length; 现在,我想知道是否能够通过不使用 len 变
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 2 年前。 Improve th
我用Java编写了一个程序,但它的计算时间很长,我不知道为什么。有人可以指点一下以降低复杂性吗?此外,在计算一些值(例如 3,100 之后)后,它会给出空指针异常。代码: public class F
我有下图,由 1 行 2 列的网格组成。我愿意 降低右侧子图的高度(3D PREDICTION),使棋盘平面看起来有点挤压并显示更好的视角。 在左侧子图的顶部添加一些边距(2D PREDICTION)
是否有一种简单的方法可以更改以 RGB 字符串形式给出的颜色的亮度? 例如 in_RGB = '#FF0000' --> out_RGB = '#CC0000' 最佳答案 将十六进制字符串转换为 R
我已经编写了代码来更改对象(不是进程)(在本例中是文件)的完整性级别。据我们所知,我们从中等完整性级别开始,但我想将其降低到“低”。我想运行完整性较低的 .txt 文件而不是默认介质。 我使用 WIN
是否可以在保持原始宽高不变的情况下降低图像分辨率? 我已经使用 BitmapFactoryOptions 尝试了几个选项: 在样本大小 inDensity、inScaled、inTargetDensi
是否有高级(Java)或低级方式(使用 native 代码)将 Android 设备上的蓝牙信号强度更改为最低? 目标是使设备在 20 厘米范围内可被发现?在 Internet 上根本找不到与此相关的
我是一名优秀的程序员,十分优秀!