- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我使用SIMD进行算术运算,结果是__m128i
包含 4 x int32_t
的变量。我怀疑前两个int32_t
结果中的值 >=0,最后两个值 <=0。我怎样才能快速找到答案呢?
__m128i result {int32_t, int32_t, int32_t, int32_t}
我怀疑结果{>=0,>=0,<=0,<=0}
最有效的方法是什么?
最佳答案
尚不清楚您是否希望将其结果存储在 XMM 寄存器中以准备进行某些屏蔽,或者将其结果存储在 GPR 寄存器中以准备分支等操作。
这可能是一个更灵活的替代方案,因为它在 XMM 寄存器中留下了一个掩码,并且从那里到 GPR 仅相距 PMOVMSKB。然而,它确实需要两个 128 位常量。
这是简单的方法:在顶部比较 > -1 又名 >= 0,并在底部进行不可能的比较,然后在底部比较 < 1 又名 <= 0,并在顶部进行不可能的比较。将它们逻辑或在一起,你就得到了你的面具。如果所有位都已设置,则所有整数都满足其条件,因此测试为 true,否则为 false。
__m128i result;
/* ... */
__m128i TOP = _mm_set_epi32(0xFFFFFFFF, 0xFFFFFFFF, 0x7FFFFFFF, 0x7FFFFFFF);
__m128i BOT = _mm_set_epi32(0x80000000, 0x80000000, 0x00000001, 0x00000001);
__m128i cmpT = _mm_cmpgt_epi32(result, TOP);//Top > -1 Bottom > INT_MAX
__m128i cmpB = _mm_cmpgt_epi32(BOT, result);//Bottom < 1, Top < INT_MIN
__m128i cmp = _mm_or_si128(cmpT, cmpB);
int cond = _mm_movemask_epi8(cmp) == 0xFFFF;
/* cond contains the result of the comparison:
0 if check failed and
1 if check satisfied. */
我在原始值及其 PSUBD 否定上利用了 PMOVMSKB,然后检查了两个返回的位掩码的正确位以获得正确的值。
__m128i result;
/* ... */
__m128i ZERO = _mm_setzero_si128(); /* 0 constant */
__m128i neg = _mm_sub_epi32(ZERO, result); /* Negate */
int lt0 = _mm_movemask_epi8(result); /* < 0 ? */
int gt0 = _mm_movemask_epi8(neg); /* > 0 ? */
gt0 &= ~lt0; /* Correction for INT_MIN. Can be
deleted if never encountered. */
int cond = !((gt0 | (lt0 >> 8)) & 0x88); /* Check both bits 3 and 7 are 0 */
/* cond contains the result of the comparison:
0 if check failed and
1 if check satisfied. */
我的解释:
lt0
,来自整数。它们代表条件result[i] < 0
.gt0
,来自否定。它们代表条件result[i] > 0
if result[i]
除外是INT_MIN
。
gt0 &= ~lt0
将 -2147483648 > 0 的任何错误报告设置为 0)。gt0
的第 3 位是 0。意味着 result[0] <= 0
.gt0
的第 7 位是 0。意味着 result[1] <= 0
.lt0
的第 11 位是 0。意味着 result[2] >= 0
.lt0
的第 15 位是 0。意味着 result[3] >= 0
.我们查看第 3、7、11 和 15 位是有原因的,也是我们使用神奇的 8 和 0x88 常量的原因。 PMOVMSKB 每个字节返回一个符号位,而不是每个双字返回一个符号位,因此我们真正感兴趣的位被我们必须忽略的垃圾位包围,只有每个整数的顶部字节的符号位感兴趣我们。
总共需要 9-10 条指令来运行检查。
关于c - SIMD SSE2 __m128i包含4个int32_t如何快速找到每个大于或小于0的整数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20768558/
我正在尝试使用 y 组合器在 Scala 中定义 gcd: object Main { def y[A,B]( f : (A => B) => A => B ) : A => B = f(y(f)
我正在尝试了解返回指向函数的指针的函数,在我尝试编译代码后,它给了我这种错误: cannot convert int (*(int))(int) to int (*(int))(int) in ass
所以我一直在关注 youtube 上的游戏编程教程,然后弹出了这段代码:bufferedImageObject.getRGB(int, int, int, int, int[], int, int);
我正在将时间现在 与存储在数据库某处的时间进行比较。数据库中存储的时间格式为“yyyyMMddHHmmss”。例如,数据库可能会为存储的时间值返回 201106203354。然后我使用一个函数将时间现
例如 Maze0.bmp (0,0) (319,239) 65 120 Maze0.bmp (0,0) (319,239) 65 120 (254,243,90) Maze0.bmp (0,0) (
评论 Steve Yegge的post关于 server-side Javascript开始讨论语言中类型系统的优点和这个 comment描述: ... examples from H-M style
我正在研究 C 的指针,从 Deitel 的书中我不明白 int(*function)(int,int) 和 int*function(int, int) 表示函数时。 最佳答案 C 中读取类型的经验
您好,我使用 weblogic 11g 创建 war 应用程序,我对 joda time 的方法有疑问 new DateTime(int, int, int, int, int, int); 这抛出了
Create a method called average that calculates the average of the numbers passed as parameters. The
var a11: Int = 0 var a12: Int = 0 var a21: Int = 0 var a22: Int = 0 var valueDeterminant = a11 * a12
我正在为一个项目设置 LED 阵列。我得到了一个 LED 阵列,可以根据引脚变化电压进行更改,但我无法添加更多引脚。 当我尝试时,编译失败并显示错误:函数“int getMode(int, int,
除了创建对列表执行简单操作的函数之外,我对 haskell 还是很陌生。我想创建一个列表,其中包含 Int 类型的内容, 和 Int -> Int -> Int 类型的函数. 这是我尝试过的: dat
这个问题已经有答案了: Java add buttons dynamically as an array [duplicate] (4 个回答) 已关闭 7 年前。 StackOverFlow问题今天
我有几个 EditText View ,我想在其中设置左侧的图像,而 setCompoundDrawablesWithIntrinsicBounds 似乎不起作用。图形似乎没有改变。 有人知道为什么会
#include using namespace std; int main() { static_assert(is_constructible, int(*)(int,int)>::val
fun sum(a: Int, b: Int) = a + b val x = 1.to(2) 我在找: sum.tupled(x),或者 sum(*x) 当然,以上都不能用 Kotlin 1.1.3
有一个函数: func (first: Int) -> Int -> Bool -> String { return ? } 返回值怎么写?我对上面 func 的返回类型感到很困惑。 最
type foo = A of int * int | B of (int * int) int * int 和 (int * int) 有什么区别?我看到的唯一区别在于模式匹配: let test_
我正在尝试制作一个 slider 游戏。在这个类中,我使用 Graphics 对象 g2 的 drawImage 方法来显示“拼图”的 block 。但在绘制类方法中,我收到此错误:找不到符号方法dr
我试着理解这个表达: static Func isOdd = i => (i & 1) == 1; 但是这是什么意思呢? 例如我有 i = 3。然后 (3 & 1) == 1 或 i = 4。然后
我是一名优秀的程序员,十分优秀!