- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用英特尔 AVX2 指令编写程序。我在我的程序中发现了一个错误,该错误仅在优化级别为 -O2 或更高时出现(使用 -O1 很好)。经过大量调试后,我缩小了有问题的区域。现在这个错误似乎是由编译器错误地优化了 __m256i 变量的简单复制分配引起的。
考虑以下代码片段。 Foo 是一个模板函数。我使用 CMP = kLess, OPT=kSet
进行测试。我知道优化器可能会优化开关。它甚至可以优化变量 y
。
错误行是 y = m_lt;
。当使用 -O2 编译时,此行似乎被忽略。然后 y
没有得到正确的值,程序产生了错误的结果。然而,程序是正确的 -O1。
为了验证我的判断,我将 y = m_lt;
替换为两个备选方案:
y = avx_or(m_lt, avx_zero());
对 m_lt
和全 0 vector 进行按位或操作
y = _mm256_load_si256(&m_lt);
使用 SIMD 加载指令从 m_lt
地址加载数据。
两者在语义上应该等同于 y = m_lt;
我的意图是通过添加一些函数来防止某些优化。该程序在所有优化级别下都可以与这两个替换项一起正常工作。所以问题很奇怪。据我所知,SIMD变量直接赋值肯定没问题(我之前用的很多)。会不会是编译器的问题?
typedef __m256i AvxUnit;
template <Comparator CMP, Bitwise OPT>
void Foo(){
AvxUnit m_lt;
//...
assert(!avx_iszero(m_lt)); //always pass
AvxUnit y;
switch(CMP){
case Comparator::kEqual:
y = m_eq;
break;
case Comparator::kInequal:
y = avx_not(m_eq);
break;
case Comparator::kLess:
y = m_lt; //**********Bug?*************
//y = avx_or(m_lt, avx_zero()); //Replace with this line is good.
//y = _mm256_load_si256(&m_lt); //Replace with this line is good too.
break;
case Comparator::kGreater:
y = m_gt;
break;
case Comparator::kLessEqual:
y = avx_or(m_lt, m_eq);
break;
case Comparator::kGreaterEqual:
y = avx_or(m_gt, m_eq);
break;
}
switch(OPT){
case Bitwise::kSet:
break;
case Bitwise::kAnd:
y = avx_and(y, bvblock->GetAvxUnit(bv_word_id));
break;
case Bitwise::kOr:
y = avx_or(y, bvblock->GetAvxUnit(bv_word_id));
break;
}
assert(!avx_iszero(y)); //pass with -O1, fail with -O2 or higher
bvblock->SetAvxUnit(y, bv_word_id);
//...
}
最佳答案
编译器放弃赋值的原因可能是它认为该行代码是死 代码。所以你的 CMP
不太可能是 Comparator::kLess
。
您尝试作为解决方法的分配可以使用 __asm__ volatile
语句来实现,并且它们无法优化。
将 m_lt
声明为 volatile 可能不会对您的性能产生太大影响,但修复它是一个肮脏的 hack。我会更多地关注 CMP
变量,看看它是否也可以采用 kLess
值。
关于c++ - g++ -O2 错误地优化了 SIMD 变量赋值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26274402/
你能解释一下这个作业是如何完成的吗, var fe, f = document.forms[0], h; 哪个等于哪个。 最佳答案 以上等同于 var fe; var f = document.for
据我测试,这两种方法都有效,但我不知道哪一种最好,也不知道它们之间的区别,这就是我想知道的。 以下是两种方法: window.location = 'http://www.google.com'; w
我正在处理用字符串填充的 numpy 数组。我的目标是分配给第一个数组 a 的切片,值包含在较小尺寸的第二个数组 b 中。 我想到的实现如下: import numpy as np a = np.em
在我使用过的其他语言(如 Erlang 和 Python)中,如果我正在拆分字符串并且不关心其中一个字段,我可以使用下划线占位符。我在 Perl 中试过这个: (_,$id) = split('
我认为这似乎很简单,但我对调用、应用、绑定(bind)感到困惑。等等 我有一个事件监听器 red.addEventListener("click", function() { j = 0;
这个问题在这里已经有了答案: What is the python "with" statement designed for? (11 个答案) 关闭 7 年前。 使用有什么区别: iFile =
这个问题在这里已经有了答案: What is the python "with" statement designed for? (11 个答案) 关闭 7 年前。 使用有什么区别: iFile =
几周前我们开始写一篇关于 Haskell 的论文,刚刚接到我们的第一个任务。我知道 SO 不喜欢家庭作业问题,所以我不会问怎么做。相反,如果有人能将我推向正确的方向,我将不胜感激。鉴于它可能不是一个特
我正在尝试为我的函数的变量根分配一个值,但似乎不起作用。我不明白这个问题。 hw7.c:155:7:警告:赋值使指针来自整数而不进行强制转换[默认启用] root = 负载(&fp, 大小); 此代码
我昨天花了大约 5 个小时来完成这个工作,并使用这个网站的帮助让代码可以工作,但我认为我这样做的方式是一种作弊方式,我使用了 scanf 命令。无论如何,我想以正确的方式解决这个问题。多谢你们!哦,代
我需要一些帮助来解决问题。 我有这个文本文件: 我将文本内容输入到字符串二维数组中,并将其转换为整数二维数组。当我转换为 int 数组时,nan 被替换为零。现在,我继续查找二维数组中每行的最大值和最
假设我有一个只能移动的类型。我们停止现有的默认提供的构造函数,但 Rvalue 引用引入了一种新的“ flavor ”,我们可以将其用于签名的移动版本: class CantCopyMe { priv
假设我有两个简单的对象,我想创建第三个对象来连接它们的属性。这非常有效: (()=>{ const a1 = {a: 2, b: 3} const b1 = {a: 100, c: 5}
我想知道我是否可以稍后在这样的代码中为 VAR 赋值 var myView: UIView func createView() { myView = UIView() { let _view =
我遇到了一些 Javascript/HTML/CSS 代码的问题。我对创建网站还很陌生,所以请多多包涵。 我最终想做的是从 javascript 中提取一个动态值并使用它对一些 div(在容器中)进行
#include class Box{ public: int x; Box(){ x=0; std::cout No move construction thanks to RV
我发现在javascript中&=运算符是按位赋值: var test=true; test&=true; //here test is an int variable javascript中是否存在
请帮助完成赋值重载函数的执行。 这是指令: 赋值运算符 (=),它将源字符串复制到目标字符串中。请注意,目标的大小需要调整为与源相同。 加法 (+) 和赋值 (=) 运算符都需要能够进行级联运算。这意
我有一个名为 SortedArrayList 的自定义结构它根据比较器对其元素进行排序,我想防止使用 operator[] 进行分配. 示例: 数组列表.h template class Array
我是 python 的新手,我看到了这种为列表赋值的形式 color= ['red' if v == 0 else 'green' for v in y] 但是如果我尝试用 3 个数字来做,例如 co
我是一名优秀的程序员,十分优秀!