c++ - 使用 SSE 或 SSE3 在 ushort 数组中添加 uchar 值-6ren

c++ - 使用 SSE 或 SSE3 在 ushort 数组中添加 uchar 值

转载作者：太空狗更新时间：2023-10-29 21:25:50

28

4

我有一个 unsigned short dst[16][16] 矩阵和一个更大的 unsigned char src[m][n] 矩阵。

现在我必须访问 src 矩阵并将一个 16x16 子矩阵添加到 dst，使用 SSE2或 SSE3 .

在旧的实现中，我确信我的总和值永远不会大于 256，所以我可以这样做:

for (int row = 0; row < 16; ++row)
{
    __m128i subMat = _mm_lddqu_si128(reinterpret_cast<const __m128i*>(src));
    dst[row] = _mm_add_epi8(dst[row], subMat);
    src += W; // Step to the next row I need to add
}

其中 W 是到达所需行的偏移量。此代码有效，但现在我在 src 中的值更大并且总和可能大于 256，因此我需要将它们存储为 ushort。

我已经尝试了以下方法，但它不起作用。

for (int row = 0; row < 16; ++row)
{
    __m128i subMat = _mm_lddqu_si128(reinterpret_cast<const __m128i*>(src));
    dst[row] = _mm_add_epi16(dst[row], subMat);
    src += W; // Step to the next row I need to add
}

我该如何解决这个问题？

编辑

谢谢保罗，但我认为你的补偿是错误的。我试过你的解决方案，似乎子矩阵的行被添加到错误的 dst 行。我希望正确的解决方案是这样的:

for (int row = 0; row < 32; row += 2)
{
    __m128i subMat = _mm_lddqu_si128(reinterpret_cast<const __m128i*>(src));
    __m128i subMatLo = _mm_unpacklo_epi8(subMat, _mm_set1_epi8(0));
    __m128i subMatHi = _mm_unpackhi_epi8(subMat, _mm_set1_epi8(0));
    dst[row] = _mm_add_epi16(dst[row], subMatLo);
    dst[row + 1] = _mm_add_epi16(dst[row + 1], subMatHi);
    src += W;
}

最佳答案

您需要将 16 x 8 位值的 vector 解压缩为两个 8 x 16 位值的 vector ，然后将这两个 vector 添加到您的目标:

for (int row = 0; row < 16; ++row)
{
    __m128i subMat = _mm_lddqu_si128(reinterpret_cast<const __m128i*>(src));
    __m128i subMatLo = _mm_unpacklo_epi8(subMat, _mm_set1_epi8(0));
    __m128i subMatHi = _mm_unpackhi_epi8(subMat, _mm_set1_epi8(0));
    dst[row] = _mm_add_epi16(dst[row], subMatLo);
    dst[row + 1] = _mm_add_epi16(dst[row + 1], subMatHi);
    src += W;
}

关于c++ - 使用 SSE 或 SSE3 在 ushort 数组中添加 uchar 值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13313572/

28

4

0

文章推荐： python - 将每个字典值转换为 utf-8(字典理解？)

文章推荐： c++ - 在 C++ OS X 中分配大空间

文章推荐： python - 模拟类方法并更改 Python 中的一些对象属性

c# - 使用 SIMD 查找 Span 中是否存在 'ushort' 的最快方法？
在 .NET Core 上的 C# 中，我正在寻找最快的方法来检查给定的 ushort 是否存在。值存在于 Span 中范围。天真的选项包括枚举跨度，但我强烈怀疑通过 SIMD(即 SSE 或 AVX
c# - 为什么 C# 会针对 ushorts 上的模运算发出错误 "cannot implicitly convert int to ushort"？
在另一个线程中，有人问为什么要添加两个 ushort值在 C# 中引发错误。例如 ushort x = 4; ushort y = 23; ushort z = x+y; // ERROR cann
C# - 尝试将两个字节转换为 ushort 导致 "Cannot implictly convert type ' int' to 'ushort' "error
代码的目的是将两个字节合并为ushort。所有变量都是ushort类型，但M_hi和M_lo加载的是一个字节。我最初将它们作为字节，但发生了这个错误，所以我尝试使用 ushort 第一部分屏蔽了较高的
c++ - VB.NET 错误 "Value of type ' Ushort' cannot be converted to 'Ushort()' "从 native C++ DLL 读取二维字节数组
我收到 VB 错误:“‘Ushort’类型的值无法转换为‘Ushort()’”。我有一个 VB.NET Windows 应用程序调用 native (C++) DLL 中的函数，以从 DLL 中的页
C# ushort[] 到字符串的转换；这可能吗？
我有一个非常痛苦的库，目前它正在接受 C# 字符串作为获取数据数组的方式；显然，这使得 pinvoke 的编码更容易。那么如何把ushort数组按字节转成字符串呢？我试过: int i; Strin
c# - 如何确定从 ushort 继承的枚举类型？
如果我像这样声明一个继承自 ushort 的枚举: public enum MyEnum : ushort { A = 0, B = 1 }; 然后像这样检查它的类型: if(typeof(MyEnu
c++ - 查看接收到的指针是字符串、ushort 还是数组
我在 C 中插入 memcpy() 函数，因为目标应用程序使用它来连接字符串，我想找出正在创建的字符串。代码是: void * my_memcpy ( void * destination, cons
c# - 控制 ushort 数组中的位
我想知道如何有效地读取和写入特定位到 ushort 整数。方法应该是这样的: // Sets the bit positioned at bitNumber in the ushort intege
c# - 将 ushort 转换为字符串
我有一个由两个字节组成的 ushort。 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 Y = bits 10-0, twos complement mantissa i
c# - 将 ushort 图像转换为二进制图像？
我在 ushort 变量中有一张图片，想以二进制格式保存这张图片。请任何人告诉我如何使用 C# 完成此操作？我试过了，但是不行 ushort[] Depthdata; Depthdata = ne
c# - byte[] 到 ushort[]
这是我的问题。请容忍我给出一点解释: 我正在将 tiff 图像读入缓冲区；我的 tiff 的每个像素都由一个 ushort 表示(16 位数据，非负数)。我的图像大小是 64*64 = 4096。当
c# - 在 ushort 中设置位范围
假设我有一个 ushort 值，我想设置位 1 到 4(假设 0 是 LSB，15 是 MSB)。在 C++ 中，您可以定义一个映射特定位的结构: struct KibblesNBits {
c# - 与 Ushort 的结果混淆
考虑以下代码: ushort a = 60000; a = (ushort)(a * a / a); Console.WriteLine("A = " + a); //这会打印出 53954。为什么
c# - ushort 数组到 Image 对象
我有一组 ushort 像素数据，我需要将其保存为 jpeg 文件。根据我的发现，我可以使用 Image.Save(path, ImageFormat.Jpeg); 但我不知道如何将 ushort 数
java - 缓冲图像 INT/4BYTE/USHORT
我知道 byte、unsigned short 和 integer 在内存使用上的区别，但是当涉及到 BufferedImage 时，它们之间是否存在“速度”差异？我一直在我的代码中使用 Ima
从 "USHORT"转换为 'int' 可能会改变它的值
我在为嵌入式平台改编一段代码时遇到了一些麻烦。 eMBFuncReadCoils( UCHAR * pucFrame, USHORT * usLen ) 上面一行是我遇到问题的函数的原型(protot
c# - 如何设置 UShort 变量的 MSB？
我有一个 UShort 变量 Temp，它的值为 1。如何将这个值的最高位设置为1。最佳答案您使用或覆盖“最左边”的位: ushort temp=1; temp |= 1<<15; 其中 1
c# - 运算符(operator) !不能应用于操作数 ushort
这个问题在这里已经有了答案: 10年前关闭。 Possible Duplicate: How do you return 'not uint' in C#? 大家好，我正在尝试将以下内容从 VB.N
c# - 将两个 ASCII 字节打包成一个 ushort
我需要能够将两个 ASCII 字节打包成一个 ushort。我怎样才能做到这一点？到目前为止我有: for (var i = 0; i > 8); byte b2 = (byte)(x & 255)
C# 对 ushort (UInt16) 进行位移
我需要对 16 位整数 (ushort/UInt16) 执行按位左移，但 C# 中的按位运算符似乎仅适用于 int(32 位)。我如何在 ushort 上使用 <<，或者至少通过简单的解决方法获得相同

首页

博学

6Ren·AI

商城

c++ - 使用 SSE 或 SSE3 在 ushort 数组中添加 uchar 值