- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
这个问题与 gcc (4.6.3 Ubuntu) 及其在使用直接操作数的 SSE 内部函数的展开循环中的行为有关。
具有立即操作数的内在函数的示例是 _mm_blend_ps。它需要一个只能是常量的 4 位立即整数。但是,使用 -O3 选项,编译器显然会自动展开循环(如果可以在编译时确定循环计数器值)并生成具有不同立即值的相应混合指令的多个实例。
这是一个简单的测试代码(blendsimple.c),它遍历了blend的立即操作数的16个可能值:
#include <stdio.h>
#include <x86intrin.h>
#define PRINT(V) \
printf("%s: ", #V); \
for (i = 3; i >= 0; i--) printf("%3g ", V[i]); \
printf("\n");
int
main()
{
__m128 a = _mm_set_ps(1, 2, 3, 4);
__m128 b = _mm_set_ps(5, 6, 7, 8);
int i;
PRINT(a);
PRINT(b);
unsigned mask;
__m128 r;
for (mask = 0; mask < 16; mask++) {
r = _mm_blend_ps(a, b, mask);
PRINT(r);
}
return 0;
}
可以用
编译这段代码gcc -Wall -march=native -O3 -o blendsimple blendsimple.c
并且代码有效。显然,编译器展开循环并为立即操作数插入常量。
但是,如果你用
编译代码gcc -Wall -march=native -O2 -o blendsimple blendsimple.c
对于 blend intrinsic,你会得到以下错误:
error: the last argument must be a 4-bit immediate
现在我试图找出哪个特定的编译器标志在 -O3 中处于事件状态,但在 -O2 中不处于事件状态,这允许编译器展开循环,但失败了。按照 gcc 在线文档
https://gcc.gnu.org/onlinedocs/gcc-4.8.2/gcc/Overall-Options.html
我执行了以下命令:
gcc -c -Q -O3 --help=optimizers > /tmp/O3-opts
gcc -c -Q -O2 --help=optimizers > /tmp/O2-opts
diff /tmp/O2-opts /tmp/O3-opts | grep enabled
它列出了所有由 -O3 而不是 -O2 启用的选项。当我添加除 -O2 之外的所有 7 个列出的标志时
gcc -Wall -march=native -O2 -fgcse-after-reload -finline-functions -fipa-cp-clone -fpredictive-commoning -ftree-loop-distribute-patterns -ftree-vectorize -funswitch-loops blendsimple blendsimple.c
我希望行为与 -O3 完全相同。但是,编译器会提示“最后一个参数必须是 4 位立即数”。
有人知道问题出在哪里吗?我认为最好知道需要哪个标志来启用这种类型的循环展开,以便可以使用 #pragma GCC optimize 或通过函数属性有选择地激活它。
(我也很惊讶 -O3 显然甚至没有启用 unroll-loops 选项)。
如有任何帮助,我将不胜感激。这是我提供的关于 SSE 编程的讲座。
编辑:非常感谢您的意见。 jtaylor 似乎是对的。我得到了两个较新版本的 gcc(4.7.3、4.8.2)和 4.8.2,无论优化级别如何,都会提示眼前的问题。此外,我后来注意到 gcc 4.6.3 使用 -O2 -funroll-loops 编译代码,但这在 4.8.2 中也失败了。因此,显然不能相信此功能,并且应该始终使用 cpp 或模板“手动”展开,正如 Jason R 指出的那样。
最佳答案
我不确定这是否适用于您的情况,因为我不熟悉 SSE 内在函数。但通常,您可以告诉编译器专门优化一段代码:
#pragma GCC push_options
#pragma GCC optimize ("unroll-loops")
do your stuff
#pragma GCC pop_options
关于c - 哪个 gcc 选项可以为带有直接操作数的 SSE 内在函数启用循环展开?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24823869/
int enter_path(char** path) { char* standard = "./questions.txt"; printf("\n\t%s\n\t%s",
我有以下几行代码: #define PORT 9987 和 char *ptr = (char *)&PORT; 这似乎适用于我的服务器代码。但是当我在我的客户端代码中写它时,它给出了这个错误信息:
大家好,我在成员函数中有以下内容 int tt = 6; vector>& temp = m_egressCandidatesByDestAndOtMode[tt]; set& egressCandi
我知道您可以通过以下方式在正则表达式中使用 NOT 操作数: [^AB] :匹配除 "A" 之外的任何内容或"B" A(?!B) :匹配"A" ,后面不跟 "B" (?
我的代码如下,下面还解释了为什么会发生左值; typedef struct test_item { char id[MENU_NAME_LEN + NULL_SPACE]; MenuF
我正在审查一些 javascript 代码,程序员在几个地方使用了 >>。我试图在谷歌上搜索但找不到这个操作数/运算符的作用。所以我来了。下面的代码示例: var triplet=(((binarra
我使用以下行(希望这是最佳实践,如果不正确请纠正我)来处理命令行选项: #!/usr/bin/bash read -r -d '' HELP &2 for i in "${invalid_opti
我正在尝试编辑一个计时器应用程序,出现了这行代码。我该如何解决? let styleMask: Int = NSClosableWindowMask | NSTitledWindowMask 错误是:
我可以得到两个特定日期之间的差异,这将等于日期总数。现在我想将工作日除以总天数并得到整数输出。 @IBAction func go(_ sender: UIButton) { let con
我的项目有一个问题,它应该使用一个线程将每一行相加,然后将它们全部相加,但是我收到一个错误,指出左值需要作为一元 '&"操作数 pthread_create(&tid, NULL, &sum_line
我的代码有问题。有以下功能: static Poly PolyFromCoeff(int coeff); static Mono MonoFromPoly(const Poly *p, int exp
在 C# 中是否没有字符串的 OR 操作数? 我正在查看 Microsoft C# 操作数页面 - 没有关于字符串的任何类型的 OR。 我有一个要写的 if 语句: if (Convert.ToStr
下面的函数左移一个double操作数: double shl(double x,unsigned long long n) { unsigned long long* p = (unsigne
我在 Linux 中使用了以下简单的 ksh 脚本 #!/bin/ksh set -x ### Process list of *.dat files if [ -f *.dat ] then pri
我有一个使用 Entity Framework 的查询。它有许多不同的操作数,我对其优先级感到困惑。我得到了错误的结果。我需要所有 IsPaid == true 或 IsPaid == null 的记
我有以下代码来尝试创建一个约束数组以添加到 View 中: let views = ["button": button] let metrics = ["margin": 16] var constr
这个问题在这里已经有了答案: How to compare one value against multiple values - Swift (8 个答案) 关闭 6 年前。 我有一种情况,我必须
我使用 jquery $.ajax 将请求发送到服务器,它返回 JSON。 $.ajax({ url: 'moreMonth.ajax', data: { startIndex: id },
我的问题是程序没有按照“他”的预期读取代码。 我有 if (hero.getPos() == (6 | 11 | 16)) { move = new Object[] {"Up", "Righ
我在对象中创建线程时遇到问题。错误是需要作为一元“&”操作数的左值 CPP文件 #include "AirQ.h" static int i=0; AirQ::AirQ(int pinNo, bool
我是一名优秀的程序员,十分优秀!