x86 - 如何在 xmm 寄存器中旋转压缩四字？-6ren

x86 - 如何在 xmm 寄存器中旋转压缩四字？

转载作者：行者123 更新时间：2023-12-01 03:09:21

给定一个 128 位 xmm包含两个四字(即两个 64 位整数)的寄存器:

     ╭──────────────────┬──────────────────╮
xmm0 │ ffeeddccbbaa9988 │ 7766554433221100 │
     ╰──────────────────┴──────────────────╯

如何对单个四字执行旋转？例如:

prorqw xmm0, 32   // rotate right packed quadwords

     ╭──────────────────┬──────────────────╮
xmm0 │ bbaa9988ffeeddcc │ 3322110077665544 │
     ╰──────────────────┴──────────────────╯

我知道 SSE2 提供:

PSHUFW : 洗牌包装话 (16 位)

PSHUFD : 洗牌包装双字 (32 位)

虽然我不知道指令是做什么的，也没有四字 (64 位)版本。

奖金问题

你会如何执行 ROR的 xmm注册 - 假设其他大小的打包数据？

右旋包装双字按 16 位:

     ╭──────────┬──────────┬──────────┬──────────╮
xmm0 │ ffeeddcc │ bbaa9988 │ 77665544 │ 33221100 │
     ╰──────────┴──────────┴──────────┴──────────╯
                        ⇓
     ╭──────────┬──────────┬──────────┬──────────╮
xmm0 │ ddccffee │ 9988bbaa │ 55447766 │ 11003322 │
     ╰──────────┴──────────┴──────────┴──────────╯

右旋包装字按 8 位:

     ╭──────┬──────┬──────┬──────┬──────┬──────┬──────┬──────╮
xmm0 │ ffee │ ddcc │ bbaa │ 9988 │ 7766 │ 5544 │ 3322 │ 1100 │
     ╰──────┴──────┴──────┴──────┴──────┴──────┴──────┴──────╯
                        ⇓
     ╭──────┬──────┬──────┬──────┬──────┬──────┬──────┬──────╮
xmm0 │ eeff │ ccdd │ aabb │ 8899 │ 6677 │ 4455 │ 2233 │ 0011 │
     ╰──────┴──────┴──────┴──────┴──────┴──────┴──────┴──────╯

额外奖励问题

如果是 256 位 ymm，您将如何执行上述操作登记？

     ╭──────────────────────────────────┬──────────────────────────────────╮
ymm0 │ 2f2e2d2c2b2a29282726252423222120 │ ffeeddccbbaa99887766554433221100 │ packed doublequadwords
     ╰──────────────────────────────────┴──────────────────────────────────╯
     ╭──────────────────┬──────────────────┬──────────────────┬──────────────────╮
ymm0 │ 2f2e2d2c2b2a2928 │ 2726252423222120 │ ffeeddccbbaa9988 │ 7766554433221100 │ packed quadwords
     ╰──────────────────┴──────────────────┴──────────────────┴──────────────────╯
     ╭──────────┬──────────┬──────────┬──────────┬──────────┬──────────┬──────────┬──────────╮
ymm0 │ 2f2e2d2c │ 2b2a2928 │ 27262524 │ 23222120 │ ffeeddcc │ bbaa9988 │ 77665544 │ 33221100 │ packed doublewords
     ╰──────────┴──────────┴──────────┴──────────┴──────────┴──────────┴──────────┴──────────╯
     ╭──────┬──────┬──────┬──────┬──────┬──────┬──────┬──────┬──────┬──────┬──────┬──────┬──────┬──────┬──────┬──────╮
ymm0 │ 2f2e │ 2d2c │ 2b2a │ 2928 │ 2726 │ 2524 │ 2322 │ 2120 │ ffee │ ddcc │ bbaa │ 9988 │ 7766 │ 5544 │ 3322 │ 1100 │ packed words
     ╰──────┴──────┴──────┴──────┴──────┴──────┴──────┴──────┴──────┴──────┴──────┴──────┴──────┴──────┴──────┴──────╯

奖励阅读

Intel Intrinsics Guide

X86 Opcode and Instruction Reference Home

Rotation or Shifting with x86/x64 Assembly

PSHUFW explanation?

最佳答案

如果旋转计数是 8 的倍数，则可以使用字节洗牌。 SSSE3 pshufb 使用控制掩码可以在一条指令中处理任何其他 8 的倍数。

SSE2 pshufd 可以处理 count=32，交换每个 qword 的两半:_MM_SHUFFLE(2,3, 0,1) ，或在 asm pshufd xmm0, xmm0, 0b10_11_00_01 (NASM 支持 _ 作为可选的分隔符，就像 C++11 的数字文字一样。)

SSE2 pshuflw + pshufhw 对于没有 SSSE3 的函数版本来说，对于 16 个计数的倍数来说还不错，但是您需要对低/高 qword 进行单独的洗牌。 (一个 imm8 控制字节仅包含四个 2 位字段。)或者使用 AVX2，用于每个 channel 内的奇数/偶数 qword。

如果旋转计数不是 8 的倍数 , 有 AVX512F vprolq zmm0, zmm1, 13 和 vprorq .也可用于可变计数版本，每个元素计数来自另一个向量而不是立即数。 vprolvq/vprorvq .也可用于双字粒度，但不能用于字或字节。

否则，只有 SSE2 且计数不是 16 的倍数，您需要左移+右移 + OR 在 asm 中实际实现在 C 中表达旋转的常用方法为 (x << n) | (x >> (64-n)) . ( Best practices for circular shift (rotate) operations in C++ 指出了从超出范围的移位计数中解决潜在 C UB 的方法，这对内在函数或 asm 不是问题，因为 asm 和内在函数的行为由英特尔明确定义:SIMD 移位使移位饱和计数，而不是像标量偏移那样掩盖它。)

SSE2 具有小至 16 位粒度的移位，因此您可以直接执行此操作。

对于字节粒度，您需要额外的掩码以将字中字节之间移位的位清零。 Efficient way of rotating a byte inside an AVX register .或者使用像 pmullw 这样的技巧具有 2 次幂元素的向量，允许每个元素的可变计数。 (其中 AVX2 通常只有 dword/qword 的可变计数移位)。

关于x86 - 如何在 xmm 寄存器中旋转压缩四字？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53643628/

文章推荐： python - Tkinter3 - 询问窗口上的指针位置？

文章推荐： javascript - Angular 4、zone.js 和 javascript 库的自定义事件

文章推荐： javascript - Nativescript 导航到同一页面

iPhone，旋转 + EAGLView，旋转 =
...沮丧。我希望我的游戏仅在横向模式下运行。我已将适当的键/值添加到 Info.plist 文件中，以强制设备方向在启动时正确。我现在正在尝试旋转 OpenGL 坐标空间以匹配设备的坐标空间。我正
java - 我将如何创建一个旋转矩阵，将 X 旋转 a，Y 旋转 b，Z 旋转 c？
我如何创建一个旋转矩阵，将 X 旋转 a，Y 旋转 b，Z 旋转 c？我需要公式，除非您使用的是 ardor3d api 的函数/方法。矩阵是这样设置的 xx, xy, xz, yx, yy, y
c++ - 从全局位置/旋转/比例更新本地位置/旋转/比例？
假设我有一个包含 3 个 vector 的类(一个用于位置，一个用于缩放，一个用于旋转)我可以使用它们生成一个变换矩阵，该矩阵表示对象在 3D 空间中的位置、旋转和大小。然后我添加对象之间的父/子关系
javascript - CSS 旋转。旋转 div 但保持在完全相同的坐标？
所以我只是在玩一个小的 javascript 游戏，构建一个 pacman 游戏。你可以在这里看到它:http://codepen.io/acha5066/pen/rOyaPW 不过我对旋转有疑问。你
iphone - iOS 旋转 MKAnnotationView 以响应 MKMapView 旋转
在我的应用程序中，我有一个 MKMapView，其中显示了多个注释。 map 根据设备的航向旋转。要旋转 map ，请执行以下语句(由方法 locationManager 调用:didUpdateHe
javascript - 旋转 90/-90 度的图像模糊 jquery 旋转
使用此 jquery 插件时:http://code.google.com/p/jqueryrotate/wiki/Documentation我将图像旋转 90 度，无论哪个方向，它们最终都会变得模糊
css - 为什么不同的 CSS3 旋转 + 平移 vs 旋转 + 左
我有以下代码:CSS: .wrapper { margin:80px auto; width:300px; border:none; } .square { widt
manim边学边做--旋转
本篇介绍Manim中的两个旋转类的动画，名称差不多，分别是Rotate和Rotating。 Rotate类主要用于对图形对象进行指定角度、围绕特定点的精确旋转，适用于几何图形演示、物理模拟和机械运动
Qt图像移动/旋转
我只想通过小部件的轴移动图像并围绕小部件的中心旋转(就像任何数字绘画软件中的 Canvas )，但它围绕其左顶点旋转...... QPainter p(this); QTransform trans;
JavaScript 旋转
我需要先旋转图像，然后再将其加载到 Canvas 中。据我所知，我无法使用 canvas.rotate() 旋转它，因为它会旋转整个场景。有没有好的JS方法来旋转图片？ [不依赖于浏览器的方式] 最
安卓横屏180°旋转
我需要知道我的 Android 设备屏幕何时从一个横向旋转到另一个横向(rotation_90 到 rotation_270)。在我的 Android 服务中，我重新实现了 onConfigurati
Python图像处理丨图像缩放、旋转、翻转与图像平移
**摘要：**本篇文章主要讲解Python调用OpenCV实现图像位移操作、旋转和翻转效果，包括四部分知识：图像缩放、图像旋转、图像翻转、图像平移。本文分享自华为云社区《[Python图像处理] 六
metal - 旋转，平移和默认相机位置
我只是在玩MTKView中的模板设置；并且，我一直在尝试了解以下内容：相机的默认位置。使用MDLMesh和MTKMesh创建基元时的默认位置。为什么轮换还涉及翻译。相关代码： matrix_f
旋转 ggplot 树状图的标签
我正在尝试使用包 dendexend 创建一个树状图。它创建了非常好的 gg 树状图，但不幸的是，当你把它变成一个“圆圈”时，标签跟不上。我将在下面提供一个示例。我的距离对象在这里:http://s
旋转 ggplot2 绘图对象
我想将一个完整的 ggplot 对象旋转 90°。我不想使用 coord_flip因为这似乎会干扰 scale="free"和 space="free"使用刻面时。例如: qplot(as.fac
人类的 opengl 旋转
我目前可以通过首先平移到轴心点然后执行旋转最后平移回原点来围绕轴心点旋转。在我的例子中，我很容易为肩膀做到这一点。但是，我不知道如何为前臂添加绕肘部的旋转。我已经尝试了以下围绕肘部旋转的前臂: 平移
jQuery 旋转/变换
我想使用此功能旋转然后停止在特定点或角度。现在该元素只是旋转而不停止。代码如下: $(function() { var $elie = $("#bkgimg");
iPhone UIImageView 旋转
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 4 年前。 Improve this ques
iphone - 基本关键帧动画(旋转)
我正在尝试创建一个非常简单的关键帧动画，其中图形通过给定的中点从一个角度旋转到另一个角度。 (目的是能够通过大于 180 度的 OBTUSE 弧角来制作旋转动画，而不是让动画“作弊”并走最短路线，即通
cocoa - 旋转 NSView
我需要旋转 NSView 实例的框架，使其宽度变为其高度，其高度变为其宽度。该 View 包含一个字符串，并且该字符串也被旋转，这一点很重要。我查看了 NSView 的 setFrameRotati

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

x86 - 如何在 xmm 寄存器中旋转压缩四字？