- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试理解 SIMD 和向量指令的概念。如果我理解正确的话:
REP 指令对数据数组进行操作,因此看起来它们实际上是 SIMD/向量指令。我还没有看到任何文章将它们描述为向量指令,而且我知道 REP 指令不是 x86 SIMD 扩展的一部分。
我的问题是:
通过谷歌快速搜索我的第三个问题,我得到了这个:
Vector-processing architectures are now considered separate from SIMD computers, based on the fact that vector computers processed the vectors one word at a time through pipelined processors (though still based on a single instruction), whereas modern SIMD computers process all elements of the vector simultaneously.
在我读过的实际文章中,我没有看到提到的差异,并且向量和 SIMD 术语可以互换使用,因此让我认为没有实际差异......
最佳答案
“矢量”和“SIMD”的含义大致相同,但在常见用法中,这些术语通常指向不同的实现方法。这种区别源于计算术语的历史。 “向量”和“SIMD”指令集都基于在操作序列内不存在数据依赖性的情况下对多个数据元素执行相同操作的概念。当不存在数据依赖性时,操作可以按任何顺序执行,包括同时执行。
从历史上看,“向量”是较旧的术语,“向量”指令被认为是通过单个功能单元对操作进行流水线操作来对元素序列执行某些操作的单个指令。 “单一功能单元”与矢量化这个概念无关——这是在晶体管非常昂贵时(20 世纪 60 年代中期到 90 年代中期)实现矢量机的方式。最近的“向量”架构使用单个向量指令来跨多个功能单元进行流水线操作。例如,NEC SX-Aurora TSUBASA处理器有256个向量寄存器和32个向量功能单元,每个256个向量向每个向量功能单元发送8个元素。我不知道“SIMD”一词何时首次使用,但我不记得在 20 世纪 90 年代中期之前看到过它的普遍使用,当时“SIMD”指令首次开发为执行多个并行的方法在现有寄存器宽度内对较小数据大小进行操作。例如,Intel MMX指令集(1997)使处理器能够对64位寄存器的内容执行独立的8/16/32位操作。后来的 SIMD 指令集(SSE 等)提供了比任何单一支持的数据类型更宽的新寄存器,以允许在寄存器内高达 64 位宽的独立字段上进行操作。指令集的设计支持跨整个SIMD寄存器宽度的操作的同时操作,但这不是必需的。例如,AMD 已经生产了几代处理器,支持比功能单元并行性更宽的 SIMD 寄存器上的指令。例如,AMD 的第一代 EPYC 处理器支持 256 位 SIMD 指令,但这些指令在两个连续周期内调度到 128 位宽的功能单元。 ARM 的可扩展向量扩展进一步解耦了向量宽度和并行功能单元数量的概念。
x86 架构中的“REP”指令为“字符串指令”和“输入/输出”指令提供类似向量的功能的能力有限。它们不是通用机制,我确信许多英特尔处理器设计者希望它们能够从指令集中删除。论坛讨论中有一些有趣的历史记录:https://software.intel.com/en-us/forums/intel-fortran-compiler/topic/275765
关于assembly - REP 指令是否被视为向量运算?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59775017/
我应该如何继续将 std::chrono::minutes::rep 类型值转换为小时表示。 #include #include using namespace std; using namesp
关闭。这个问题需要更多focused .它目前不接受答案。 想改善这个问题吗?更新问题,使其仅关注一个问题 editing this post . 4年前关闭。 Improve this questi
我有一个带有3个kafka节点和3个zk节点的kakfa集群。 生产者在AWS机器上尝试将数据推送到我的Intranet服务器上运行的kafka集群上。 使用以下命令从控制台创建主题(JOB_AWS_
我有关于序列和 each 的快速问题: vect1 <- c(4, 5, 10, 3, 1) 我想用这个向量复制每个,这样第一个数字被复制 4,第二个 5,第三个 10,第四个 3 和第五个等于 1。
当我在控制台中键入泛型的函数名称时,我希望看到对 UseMethod 的调用。例如,the documentation for determinant 将其称为泛型,当我将其输入控制台时得到以下输出:
我正在尝试理解 SIMD 和向量指令的概念。如果我理解正确的话: 向量指令是对一维数据数组(=向量)进行操作的指令,而不是对单个数据项进行操作的标量指令。 SIMD指令实际上是单指令多数据指令,看起来
引用英特尔® 64 和 IA-32 架构优化引用手册,第 2.4.6 节“REP 字符串增强”: The performance characteristics of using REP string
我正在尝试编写一个应用程序,允许用户启动长时间运行的计算进程,该进程将从使用 ØMQ 的 Web 服务器接收命令。我使用标准的请求-回复架构:服务器有一个连接到工作进程 REP 套接字的 REQ 套接
我希望使用多线程通过 Python 和 ZeroMQ 实现 REQ-REP 模式。 使用 Python,我可以在新客户端连接到服务器时创建一个新线程。该线程将处理与该特定客户端的所有通信,直到套接字关
我想创建一个列表,它是向量的 8 倍 c(2,6) ,即 8 个向量的列表。 错误:object = as.list(rep(c(2,6),8))结果是 16 个单个数字的列表:2 6 2 6 2 6
我需要将一个向量分解成一系列 x 并重复,我不太确定这个术语是什么。它是 rep 的倒数功能。所以一个向量 [1,2,2,2,2,1,1,1,1,1,2,2] -> [1x1, 4x2, 5x1, 2
x=1:20 [1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 rep(x,2) [1] 1 2 3 4 5 6 7 8 9 10 11 1
假设我做了一个长 REP INSB在普通优先级线程中从用户模式读取 PCI 设备寄存器。在它执行期间,以下哪些可以发生,哪些不能发生: 中断(其他内核) 中断(同核) PCI 访问(其他内核) PCI
怎么才能使用说明rep stosb执行速度比这段代码快? Clear: mov byte [edi],AL ; Write the value in AL to memory
我需要从端口读取一些 16 位值并将它们保存到缓冲区。我正在使用的教程建议使用 REP INSW 指令,但我不知道如何使用它,甚至不知道它是如何工作的...... 这条指令相当于两条IN指令吗? 最佳
什么是重用/发布等效原则以及为什么它很重要? 最佳答案 重用/发布等效原则 (REP) 说: The unit of reuse is the unit of release. Effective r
给定一个向量,例如 > x [1] 1 1 2 1 1 1 5 1 1 1 5 7 1 1 1 1 1 1 1 1 1 我想复制元素n次——但是——我希望旧元素被复制覆盖。使用基本的 rep 函数给
我需要从端口读取一些 16 位值并将它们保存到缓冲区。我正在使用的教程建议使用 REP INSW 指令,但我不知道如何使用它,甚至不知道它是如何工作的...... 这条指令相当于两条IN指令吗? 最佳
我在 Visual Studio 2008 上测试一些代码并注意到 security_cookie。我能理解它的意思,但我不明白这个指令的目的是什么。 rep ret /* REP to av
我想知道是否有更简单的方法来制作列表,例如 10 '4'、20 '6' 和 30 '3' 然后用函数 'rep 手写 (example <- c(4,4,4,4,...)) '.我知道我可以将某个序列
我是一名优秀的程序员,十分优秀!