LLVM 内在函数-6ren

LLVM 内在函数

转载作者：行者123 更新时间：2023-12-03 16:54:16

使用 LLVM 构建项目时，一些函数调用将被内部函数替换。替换是由前端(例如clang)还是LLVM后端完成的？

通过互联网的讨论表明，内在函数替换与优化选项有关。那么这是否意味着如果没有优化选项，则不会发生内在替换？或者实际上，有一些不能禁用的默认内在函数替换？

如果有任何方法可以禁用所有内在函数，我应该怎么做？

最佳答案

这取决于。用代码编写的内部函数直接通过前端发出。像 llvm.memset 这样的内部函数在 IR 级别的优化过程中被引入代码(前端或后端执行此优化)。

这是一个(相当愚蠢的)例子:

int main(int argc, char** argv)
{
        int a[8];

        for (int i = 0; i != 8; ++i)
                a[i] = 0;

        for (int i = 7; i >= 0; --i)
                a[i] = a[i+1] + argc;

        return a[0];
}

使用 clang 3.5 (clang -S -emit-llvm) 编译，您将获得以下没有任何内在函数的 IR:

; Function Attrs: nounwind uwtable
define i32 @main(i32 %argc, i8** %argv) #0 {
  %1 = alloca i32, align 4
  %2 = alloca i32, align 4
  %3 = alloca i8**, align 8
  %a = alloca [8 x i32], align 16
  %i = alloca i32, align 4
  %i1 = alloca i32, align 4
  store i32 0, i32* %1
  store i32 %argc, i32* %2, align 4
  store i8** %argv, i8*** %3, align 8
  store i32 0, i32* %i, align 4
  br label %4

; <label>:4                                       ; preds = %11, %0
  %5 = load i32* %i, align 4
  %6 = icmp ne i32 %5, 8
  br i1 %6, label %7, label %14

; <label>:7                                       ; preds = %4
  %8 = load i32* %i, align 4
  %9 = sext i32 %8 to i64
  %10 = getelementptr inbounds [8 x i32]* %a, i32 0, i64 %9
  store i32 0, i32* %10, align 4
  br label %11

; <label>:11                                      ; preds = %7
  %12 = load i32* %i, align 4
  %13 = add nsw i32 %12, 1
  store i32 %13, i32* %i, align 4
  br label %4

; <label>:14                                      ; preds = %4
  store i32 7, i32* %i1, align 4
  br label %15

; <label>:15                                      ; preds = %29, %14
  %16 = load i32* %i1, align 4
  %17 = icmp sge i32 %16, 0
  br i1 %17, label %18, label %32

; <label>:18                                      ; preds = %15
  %19 = load i32* %i1, align 4
  %20 = add nsw i32 %19, 1
  %21 = sext i32 %20 to i64
  %22 = getelementptr inbounds [8 x i32]* %a, i32 0, i64 %21
  %23 = load i32* %22, align 4
  %24 = load i32* %2, align 4
  %25 = add nsw i32 %23, %24
  %26 = load i32* %i1, align 4
  %27 = sext i32 %26 to i64
  %28 = getelementptr inbounds [8 x i32]* %a, i32 0, i64 %27
  store i32 %25, i32* %28, align 4
  br label %29

; <label>:29                                      ; preds = %18
  %30 = load i32* %i1, align 4
  %31 = add nsw i32 %30, -1
  store i32 %31, i32* %i1, align 4
  br label %15

; <label>:32                                      ; preds = %15
  %33 = getelementptr inbounds [8 x i32]* %a, i32 0, i64 0
  %34 = load i32* %33, align 4
  ret i32 %34
}

再次编译 clang -emit-llvm -O1你会看到这个:

; Function Attrs: nounwind readnone uwtable
define i32 @main(i32 %argc, i8** nocapture readnone %argv) #0 {
.preheader:
  %a = alloca [8 x i32], align 16
  %a6 = bitcast [8 x i32]* %a to i8*
  call void @llvm.memset.p0i8.i64(i8* %a6, i8 0, i64 32, i32 4, i1 false)
  br label %0

; <label>:0                                       ; preds = %.preheader, %0
  %indvars.iv = phi i64 [ 7, %.preheader ], [ %indvars.iv.next, %0 ]
  %1 = add nsw i64 %indvars.iv, 1
  %2 = getelementptr inbounds [8 x i32]* %a, i64 0, i64 %1
  %3 = load i32* %2, align 4, !tbaa !1
  %4 = add nsw i32 %3, %argc
  %5 = getelementptr inbounds [8 x i32]* %a, i64 0, i64 %indvars.iv
  store i32 %4, i32* %5, align 4, !tbaa !1
  %indvars.iv.next = add nsw i64 %indvars.iv, -1
  %6 = trunc i64 %indvars.iv to i32
  %7 = icmp sgt i32 %6, 0
  br i1 %7, label %0, label %8

; <label>:8                                       ; preds = %0
  %9 = getelementptr inbounds [8 x i32]* %a, i64 0, i64 0
  %10 = load i32* %9, align 16, !tbaa !1
  ret i32 %10
}

初始化循环被 llvm.memset 内在函数取代。后端可以随意处理内部函数，但通常 llvm.memset 被降低为 libc 库调用。

回答你的第一个问题:是的，如果你不优化你的代码，那么你将不会在你的 IR 中获得内在函数。

为了防止在您的代码中引入内在函数，您所要做的就是在您的 IR 上找到优化传递并且不要运行它。这是一个相关的问题，如何找出在 IR 上完成了哪些传递: Where to find the optimization sequence for clang -OX?

为 -O1我们得到:

prune-eh -inline-cost -always-inline -functionattrs -sroa -domtree -early-cse -lazy-value-info -jump-threading -correlated-propagation -simplifycfg -instcombine -tailcallelim -simplifycfg -reassociate -domtree -loops -loop-simplify -lcssa -loop-rotate -licm -loop-unswitch -instcombine -scalar-evolution -lcssa -indvars -loop-idiom -loop-deletion -loop-unroll -memdep -memcpyopt -sccp -instcombine -lazy-value-info -jump-threading -correlated-propagation -domtree -memdep -dse -adce -simplifycfg -instcombine -barrier -domtree -loops -loop-simplify -lcssa -branch-prob -block-freq -scalar-evolution -loop-vectorize -instcombine -simplifycfg -strip-dead-prototypes -verify

一个疯狂的猜测:instcombine 正在引入 llvm.memset。我在没有 instcombine 的情况下运行通行证并选择未优化的 IR 并得到这个:

; Function Attrs: nounwind readnone uwtable
define i32 @main(i32 %argc, i8** %argv) #0 {
  %a = alloca [8 x i32], align 16
  %1 = getelementptr inbounds [8 x i32]* %a, i32 0, i64 8
  %2 = load i32* %1, align 4
  %3 = add nsw i32 %2, %argc
  %4 = getelementptr inbounds [8 x i32]* %a, i32 0, i64 7
  store i32 %3, i32* %4, align 4
  %5 = getelementptr inbounds [8 x i32]* %a, i32 0, i64 7
  %6 = load i32* %5, align 4
  %7 = add nsw i32 %6, %argc
  %8 = getelementptr inbounds [8 x i32]* %a, i32 0, i64 6
  store i32 %7, i32* %8, align 4
  %9 = getelementptr inbounds [8 x i32]* %a, i32 0, i64 6
  %10 = load i32* %9, align 4
  %11 = add nsw i32 %10, %argc
  %12 = getelementptr inbounds [8 x i32]* %a, i32 0, i64 5
  store i32 %11, i32* %12, align 4
  %13 = getelementptr inbounds [8 x i32]* %a, i32 0, i64 5
  %14 = load i32* %13, align 4
  %15 = add nsw i32 %14, %argc
  %16 = getelementptr inbounds [8 x i32]* %a, i32 0, i64 4
  store i32 %15, i32* %16, align 4
  %17 = getelementptr inbounds [8 x i32]* %a, i32 0, i64 4
  %18 = load i32* %17, align 4
  %19 = add nsw i32 %18, %argc
  %20 = getelementptr inbounds [8 x i32]* %a, i32 0, i64 3
  store i32 %19, i32* %20, align 4
  %21 = getelementptr inbounds [8 x i32]* %a, i32 0, i64 3
  %22 = load i32* %21, align 4
  %23 = add nsw i32 %22, %argc
  %24 = getelementptr inbounds [8 x i32]* %a, i32 0, i64 2
  store i32 %23, i32* %24, align 4
  %25 = getelementptr inbounds [8 x i32]* %a, i32 0, i64 2
  %26 = load i32* %25, align 4
  %27 = add nsw i32 %26, %argc
  %28 = getelementptr inbounds [8 x i32]* %a, i32 0, i64 1
  store i32 %27, i32* %28, align 4
  %29 = getelementptr inbounds [8 x i32]* %a, i32 0, i64 1
  %30 = load i32* %29, align 4
  %31 = add nsw i32 %30, %argc
  %32 = getelementptr inbounds [8 x i32]* %a, i32 0, i64 0
  store i32 %31, i32* %32, align 4
  %33 = getelementptr inbounds [8 x i32]* %a, i32 0, i64 0
  %34 = load i32* %33, align 4
  ret i32 %34
}

没有说明。因此，为了防止(至少是 memset)代码中的内在函数，请不要在 IR 上运行 instcombine。然而，instcombine 是一个强大的 opt pass，它确实缩短了代码。

现在你有两个选择:

不要使用引入内在函数的 opt pass

写你自己的 llvm
opt pass 将内在函数转换回它们可能的样子
替换为在优化之后和后端之前运行它
开始工作

我希望这能以某种方式帮助你。干杯!

关于LLVM 内在函数，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27511899/

文章推荐：提交表单中的 Laravel 日期格式 (d-M-Y)

文章推荐： android - 使用附加参数跟踪每个屏幕查看持续时间

文章推荐： angularjs - Ui-sref 不生成可点击的链接/不工作

llvm - 无法从其源代码构建 LLVM
我指的是 https://llvm.org/docs/GettingStarted.html从其源代码构建 LLVM。我正在使用 Ubuntu 18.04。 $ cmake -G Ninja -DCM
llvm - LLVM 操作数的遍历
使用 ModulePass，我的目标是向上遍历 SSA 图:从一个具有 0..2 个操作数的语句(大多数操作码属于该语句)开始，我想找出两件事: 操作数是元数据/常量(简单:只需尝试转换为常量类型)还
llvm - LLVM 做了哪些类型的优化以及它的前端必须自行实现哪些类型的优化？
注意:我注意到 this question与这个问题有很大关系，所以如果您对我的问题感兴趣，那么您一定要阅读另一个问题及其答案。我可以想到一些 OOP 语言前端可以做的优化，例如创建临时变量来保存来
llvm - llvm 中的自动矢量化
我正在尝试使用 clang-3.2 创建自动矢量化代码从这里的幻灯片 - http://llvm.org/devmtg/2012-04-12/Slides/Hal_Finkel.pdf 我应该能够使
llvm - 在新的pass中使用现有pass生成的信息，LLVM
我想问的是，我们可以将现有pass生成的信息转化为新pass吗？如果是，那么如何？例如 -loops 给出了自然循环信息，所以我们可以通过调用它来将这些信息用于新的传递。最佳答案您可以通过覆盖
llvm - LLVM 中数组索引方式的区别
在 LLVM IR 中，当我想从一个数组中获取一个值时，似乎有三种方法可以做到这一点:使用 extractvalue、使用 extractelement 和使用 getelementptr 然后加载。
llvm - LLVM IR是否有调试器？
我想逐步介绍一下我生成的LLVM IR代码。就llc和lli而言，该代码在语法上是有效的并且类型有效，但是结果不是我所期望的。这些块足够大，以至于我无法简单地读取该错误就无法成功完成，并且我很难制作
llvm - LLVM 蹦床需要多少空间
我想弄清楚如何使用 trampoline intrinsics在 LLVM 中。该文档提到了存储蹦床所需的一些存储量，这取决于平台。我的问题是，我如何确定需要多少？我找到了 this example
llvm - LLVM 中的抽象解释
我需要使用抽象解释来使用 LLVM 进行一些分析。这可能吗？或者我需要更轻松地使用分析工具。如果我可以通过 LLVM 做到这一点，哪些类将帮助我从原始源代码中制定语句以获取变量之间的关系(以及每个变量
llvm - LLVM 的整数溢出捕获？
我正在创建一种静态编译的编程语言，并使用 LLVM 作为其后端。我希望我的语言在发生整数溢出时陷入/崩溃。我知道类似 llvm.sadd.with.overflow 的事情，但我认为这不是最佳/有效
llvm - LLVM tablegen中的字段关键字是什么意思？
我正在尝试学习 LLVM tablegen。 http://llvm.org/docs/TableGen/LangRef.html表明 field关键字存在但不解释其含义。有人知道这是什么意思吗？我
llvm - 如何将生成的 llvm::Module 的 LLVM-IR 代码存储到字符串中？
Fibonacci LLVM 示例使用 errs() getIR() ) 我一直在搜索 llvm::Module Class Reference并没有得到任何帮助。 Fibonacci.cpp 的一部
llvm - 在 llvm IR 中找到 llvm.pow.f64
我想在 llvm IR 中找到对 llvm.pow.f64 函数的所有函数调用。请建议我一个方法来做到这一点。最佳答案嗯，这是一个基本的 FunctionPass找到所有对函数的调用: class
llvm - 如何删除未使用的 basicblocks llvm
我正在尝试从 llvm 中间代码中删除未使用的 block 。首先，我通过从入口 basicblock 开始并从它们的终止符指令添加所有 basicblock 后继者来构建可访问的 basicblo
llvm - 在 LLVM 中查找指令的后继列表
我想获取 llvm 中每条指令的后继列表。如果我没理解错的话，对于除了branch(br)之外的所有指令，后继指令就是下一条。但是对于分支指令来说有点棘手。例如，如果我有以下 C 代码: int m
llvm - 我如何解析 LLVM IR
我有文本格式的 LLVM IR 代码。我想做的是能够解析它并修改该代码。是否有可以帮助解析 LLVM IR 代码的 API？我的系统中应该有哪些库？此刻我有clang编译器也安装了 LLVM，因为我可
llvm - getelementptr 类型后的预期逗号。 LLVM
(1) @str = private constant [13 x i8] c"Hello World\0A\00" (2) define i32 @main(){ (3) %r2 = getelem
llvm - 在 llvm 中创建新函数
如果我有一组基本块和边，我需要为它们创建一个具有新入口和端点的新函数。我可以直接在 LLVM 中创建它吗，就像 createFunction(F) 一样然后 F.insert(bb, edges)其
llvm - 在基于 LLVM 的编译器中如何处理符号表？
我通过教程使用 LLVM http://llvm.org/releases/3.1/docs/tutorial/ 编写玩具编译器但是关于符号表处理的内容并不多。有一个命令 llvm-nm 显示符号
llvm - 在 LLVM 中向函数添加参数
我希望编写一个 LLVM 传递两个 i32 类型的参数来选择函数。我的第一次尝试(如下所示)失败了: bool MyFunctionPass::runOnFunction(Function &f) {

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

LLVM 内在函数