- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我有一个 unsigned short dst[16][16] 矩阵和一个更大的 unsigned char src[m][n] 矩阵。
现在我必须访问 src 矩阵并将一个 16x16 子矩阵添加到 dst,使用 SSE2或 SSE3 .
在旧的实现中,我确信我的总和值永远不会大于 256,所以我可以这样做:
for (int row = 0; row < 16; ++row)
{
__m128i subMat = _mm_lddqu_si128(reinterpret_cast<const __m128i*>(src));
dst[row] = _mm_add_epi8(dst[row], subMat);
src += W; // Step to the next row I need to add
}
其中 W 是到达所需行的偏移量。此代码有效,但现在我在 src 中的值更大并且总和可能大于 256,因此我需要将它们存储为 ushort。
我已经尝试了以下方法,但它不起作用。
for (int row = 0; row < 16; ++row)
{
__m128i subMat = _mm_lddqu_si128(reinterpret_cast<const __m128i*>(src));
dst[row] = _mm_add_epi16(dst[row], subMat);
src += W; // Step to the next row I need to add
}
我该如何解决这个问题?
编辑
谢谢保罗,但我认为你的补偿是错误的。我试过你的解决方案,似乎子矩阵的行被添加到错误的 dst 行。我希望正确的解决方案是这样的:
for (int row = 0; row < 32; row += 2)
{
__m128i subMat = _mm_lddqu_si128(reinterpret_cast<const __m128i*>(src));
__m128i subMatLo = _mm_unpacklo_epi8(subMat, _mm_set1_epi8(0));
__m128i subMatHi = _mm_unpackhi_epi8(subMat, _mm_set1_epi8(0));
dst[row] = _mm_add_epi16(dst[row], subMatLo);
dst[row + 1] = _mm_add_epi16(dst[row + 1], subMatHi);
src += W;
}
最佳答案
您需要将 16 x 8 位值的 vector 解压缩为两个 8 x 16 位值的 vector ,然后将这两个 vector 添加到您的目标:
for (int row = 0; row < 16; ++row)
{
__m128i subMat = _mm_lddqu_si128(reinterpret_cast<const __m128i*>(src));
__m128i subMatLo = _mm_unpacklo_epi8(subMat, _mm_set1_epi8(0));
__m128i subMatHi = _mm_unpackhi_epi8(subMat, _mm_set1_epi8(0));
dst[row] = _mm_add_epi16(dst[row], subMatLo);
dst[row + 1] = _mm_add_epi16(dst[row + 1], subMatHi);
src += W;
}
关于c++ - 使用 SSE 或 SSE3 在 ushort 数组中添加 uchar 值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13313572/
在 .NET Core 上的 C# 中,我正在寻找最快的方法来检查给定的 ushort 是否存在。值存在于 Span 中范围。天真的选项包括枚举跨度,但我强烈怀疑通过 SIMD(即 SSE 或 AVX
在另一个线程中,有人问为什么要添加两个 ushort值在 C# 中引发错误。例如 ushort x = 4; ushort y = 23; ushort z = x+y; // ERROR cann
代码的目的是将两个字节合并为ushort。所有变量都是ushort类型,但M_hi和M_lo加载的是一个字节。我最初将它们作为字节,但发生了这个错误,所以我尝试使用 ushort 第一部分屏蔽了较高的
我收到 VB 错误:“‘Ushort’类型的值无法转换为‘Ushort()’”。 我有一个 VB.NET Windows 应用程序调用 native (C++) DLL 中的函数,以从 DLL 中的页
我有一个非常痛苦的库,目前它正在接受 C# 字符串作为获取数据数组的方式;显然,这使得 pinvoke 的编码更容易。 那么如何把ushort数组按字节转成字符串呢?我试过: int i; Strin
如果我像这样声明一个继承自 ushort 的枚举: public enum MyEnum : ushort { A = 0, B = 1 }; 然后像这样检查它的类型: if(typeof(MyEnu
我在 C 中插入 memcpy() 函数,因为目标应用程序使用它来连接字符串,我想找出正在创建的字符串。代码是: void * my_memcpy ( void * destination, cons
我想知道如何有效地读取和写入特定位到 ushort 整数。 方法应该是这样的: // Sets the bit positioned at bitNumber in the ushort intege
我有一个由两个字节组成的 ushort。 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 Y = bits 10-0, twos complement mantissa i
我在 ushort 变量中有一张图片,想以二进制格式保存这张图片。 请任何人告诉我如何使用 C# 完成此操作? 我试过了,但是不行 ushort[] Depthdata; Depthdata = ne
这是我的问题。请容忍我给出一点解释: 我正在将 tiff 图像读入缓冲区;我的 tiff 的每个像素都由一个 ushort 表示(16 位数据,非负数)。 我的图像大小是 64*64 = 4096。当
假设我有一个 ushort 值,我想设置位 1 到 4(假设 0 是 LSB,15 是 MSB)。 在 C++ 中,您可以定义一个映射特定位的结构: struct KibblesNBits {
考虑以下代码: ushort a = 60000; a = (ushort)(a * a / a); Console.WriteLine("A = " + a); //这会打印出 53954。为什么
我有一组 ushort 像素数据,我需要将其保存为 jpeg 文件。根据我的发现,我可以使用 Image.Save(path, ImageFormat.Jpeg); 但我不知道如何将 ushort 数
我知道 byte、unsigned short 和 integer 在内存使用上的区别,但是当涉及到 BufferedImage 时,它们之间是否存在“速度”差异? 我一直在我的代码中使用 Ima
我在为嵌入式平台改编一段代码时遇到了一些麻烦。 eMBFuncReadCoils( UCHAR * pucFrame, USHORT * usLen ) 上面一行是我遇到问题的函数的原型(protot
我有一个 UShort 变量 Temp,它的值为 1。 如何将这个值的最高位设置为1。 最佳答案 您使用 或 覆盖“最左边”的位: ushort temp=1; temp |= 1<<15; 其中 1
这个问题在这里已经有了答案: 10年前关闭。 Possible Duplicate: How do you return 'not uint' in C#? 大家好, 我正在尝试将以下内容从 VB.N
我需要能够将两个 ASCII 字节打包成一个 ushort。我怎样才能做到这一点? 到目前为止我有: for (var i = 0; i > 8); byte b2 = (byte)(x & 255)
我需要对 16 位整数 (ushort/UInt16) 执行按位左移,但 C# 中的按位运算符似乎仅适用于 int(32 位)。我如何在 ushort 上使用 <<,或者至少通过简单的解决方法获得相同
我是一名优秀的程序员,十分优秀!