gpt4 book ai didi

c++ - 为什么 clang 会忽略 __restrict__?

转载 作者:塔克拉玛干 更新时间:2023-11-02 23:39:29 28 4
gpt4 key购买 nike

我刚刚测试了一个小例子来检查 __restrict__ 是否在最新编译器的 C++ 中工作:

void foo(int x,int* __restrict__ ptr1, int& v2) {
for(int i=0;i<x;i++) {
if(*ptr1==v2) {
++ptr1;
} else {
*ptr1=*ptr1+1;
}
}
}

当使用最新的 gcc (gcc8.1 -O3 -std=c++14) 在 godbolt.org 上尝试时,__restrict__ 按预期工作:v2只加载一次,因为它不能使用 ptr1 别名。

这里是相关的装配部件:

.L5:
mov eax, DWORD PTR [rsi]
cmp eax, ecx # <-- ecx contains v2, no load from memory
jne .L3
add edx, 1
add rsi, 4
cmp edi, edx
jne .L5

现在与最新的 clang (clang 6.0.0 -O3 -std=c++14) 相同。它展开循环一次,因此生成的代码要大得多,但这里是要点:

.LBB0_3: # =>This Inner Loop Header: Depth=1
mov edi, dword ptr [rsi]
cmp edi, dword ptr [rdx] # <-- restrict didn't work, v2 loaded from memory in hot loop
jne .LBB0_9
add rsi, 4
mov edi, dword ptr [rsi]
cmp edi, dword ptr [rdx] # <-- restrict didn't work, v2 loaded from memory in hot loop
je .LBB0_12

为什么会这样?我知道 __restrict__ 是非标准的,编译器可以随意忽略它,但它似乎是从代码中获得最后一点性能的非常基本的技术,所以我怀疑 clang在支持和忽略关键字本身的同时根本不支持它。那么,这里的问题是什么?我做错了什么吗?

最佳答案

这么多无用的评论...

这似乎是 Clang 别名分析器中的一个错误。如果您将 v2 的类型更改为 short,编译器会根据基于类型的别名规则愉快地将其从循环中移除:

for.body:                                         ; preds = %for.inc, %for.body.lr.ph
%i.09 = phi i32 [ 0, %for.body.lr.ph ], [ %inc, %for.inc ]
%ptr1.addr.08 = phi i32* [ %ptr1, %for.body.lr.ph ], [ %ptr1.addr.1, %for.inc ]
%1 = load i32, i32* %ptr1.addr.08, align 4, !tbaa !5
%cmp1 = icmp eq i32 %1, %conv
br i1 %cmp1, label %if.then, label %if.else

但是对于原始循环,您会为两个内存引用设置相同的别名,这就是中端无法优化它的原因:

  %i.08 = phi i32 [ %inc, %for.inc ], [ 0, %for.body.preheader ]
%ptr1.addr.07 = phi i32* [ %ptr1.addr.1, %for.inc ], [ %ptr1, %for.body.preheader ]
%0 = load i32, i32* %ptr1.addr.07, align 4, !tbaa !1
%1 = load i32, i32* %v2, align 4, !tbaa !1
%cmp1 = icmp eq i32 %0, %1
br i1 %cmp1, label %if.then, label %if.else

请注意 !tbaa !1 附加到两个内存引用,这意味着编译器无法区分它们中的任何一个访问的内存。似乎 restrict 注解一路丢失了...

我鼓励您使用最新的 Clang 重现此内容并在 LLVM Bugzilla 中提交错误(一定要抄送 Hal Finkel)。

关于c++ - 为什么 clang 会忽略 __restrict__?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50365141/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com