c++ - LLVM IR : Identifying Variables with Metadata Nodes-6ren

c++ - LLVM IR : Identifying Variables with Metadata Nodes

转载作者：塔克拉玛干更新时间：2023-11-02 23:37:09

29

4

目前我正在开发一种工具，该工具可以识别对任意程序的全局变量和字段变量的加载和存储访问。此外，访问的变量应该由它们的源级别名称/标识符来标识。为了完成这个，我将被诊断程序的源代码编译成带有调试信息的 LLVM IR。到目前为止一切顺利，生成的元数据节点包含所需的源级别标识符。但是，我无法将某些 LLVM IR 标识符和元数据中的信息联系起来。

例如，考虑一个类的静态成员:

 class TestClass {
   public:
    static int Number;
};

相应的 LLVM IR 如下所示:

@_ZN12TestClass6NumberE = external global i32, align 4

...
!15 = !DIDerivedType(tag: DW_TAG_member, name: "Number", scope: !"_ZTS12TestClass", file: !12, line: 5, baseType: !16, flags: DIFlagPublic | DIFlagStaticMember)

在这个受控示例中，我知道“@_ZN12TestClass6NumberE”是“Number”的标识符。但是，总的来说，我看不出如何找出哪些 IR 标识符对应于哪些元数据。

有人可以帮帮我吗？

最佳答案

由于似乎没有人能很好地解决我的问题，所以我将讲述我自己处理这个问题的不方便方法。 LLVM 生成的元数据节点包含有关代码的已定义类型和变量的信息。但是，没有关于哪些生成的 IR 变量对应于哪些源代码变量的信息。 LLVM 仅将 IR 指令的元数据信息与相应的源位置(行和列)链接起来。这是有道理的，因为 LLVM 元数据的主要任务不是分析而是调试。

不过，其中包含的信息并非毫无用处。我对这个问题的解决方案是使用 clang AST 来分析源代码。在这里，我们获得有关在哪个源位置访问哪个变量的信息。因此，为了在 LLVM IR 检测期间获取有关源变量身份的信息，我们只需要在 clang AST 分析期间将源位置映射到源变量身份。作为第二步，我们使用之前收集的信息执行 IR 检测。当我们在 IR 中遇到存储或加载指令时，我们会在该指令的元数据节点中搜索其对应的源位置。由于我们已将源位置映射到源变量标识，我们现在可以轻松访问 IR 指令的源变量标识。

那么，为什么我不直接使用 clang AST 来识别变量的存储和加载？因为在 AST 中区分读取和写入并不是一件简单的工作。 AST 可以很容易地告诉您访问了一个变量，但这取决于访问的变量是读取还是写入的操作。因此，我将不得不考虑每一个操作/运算符来确定变量是被写入/读取还是两者兼而有之。在这方面，LLVM 更简单、更底层，因此更不容易出错。此外，与 LLVM 相比，AST 中的实际检测(说出代码插入)要困难得多。由于这两个原因，我相信结合使用 clang AST 和 LLVM IR 检测是解决我的问题的最佳方案。

关于c++ - LLVM IR : Identifying Variables with Metadata Nodes，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34578398/

29

4

0

文章推荐： java.lang.String 类型的 Android Value ... 无法转换为 JSONArray

文章推荐： c++ - Linux 将连续输出作为命令行参数传递

文章推荐： linux - 从输出中 grep 并在第一次出现时做一些事情

文章推荐： c++ - 如何强制 std::sort 使用 move 构造函数和 move 赋值？

llvm - 无法从其源代码构建 LLVM
我指的是 https://llvm.org/docs/GettingStarted.html从其源代码构建 LLVM。我正在使用 Ubuntu 18.04。 $ cmake -G Ninja -DCM
llvm - LLVM 操作数的遍历
使用 ModulePass，我的目标是向上遍历 SSA 图:从一个具有 0..2 个操作数的语句(大多数操作码属于该语句)开始，我想找出两件事: 操作数是元数据/常量(简单:只需尝试转换为常量类型)还
llvm - LLVM 做了哪些类型的优化以及它的前端必须自行实现哪些类型的优化？
注意:我注意到 this question与这个问题有很大关系，所以如果您对我的问题感兴趣，那么您一定要阅读另一个问题及其答案。我可以想到一些 OOP 语言前端可以做的优化，例如创建临时变量来保存来
llvm - llvm 中的自动矢量化
我正在尝试使用 clang-3.2 创建自动矢量化代码从这里的幻灯片 - http://llvm.org/devmtg/2012-04-12/Slides/Hal_Finkel.pdf 我应该能够使
llvm - 在新的pass中使用现有pass生成的信息，LLVM
我想问的是，我们可以将现有pass生成的信息转化为新pass吗？如果是，那么如何？例如 -loops 给出了自然循环信息，所以我们可以通过调用它来将这些信息用于新的传递。最佳答案您可以通过覆盖
llvm - LLVM 中数组索引方式的区别
在 LLVM IR 中，当我想从一个数组中获取一个值时，似乎有三种方法可以做到这一点:使用 extractvalue、使用 extractelement 和使用 getelementptr 然后加载。
llvm - LLVM IR是否有调试器？
我想逐步介绍一下我生成的LLVM IR代码。就llc和lli而言，该代码在语法上是有效的并且类型有效，但是结果不是我所期望的。这些块足够大，以至于我无法简单地读取该错误就无法成功完成，并且我很难制作
llvm - LLVM 蹦床需要多少空间
我想弄清楚如何使用 trampoline intrinsics在 LLVM 中。该文档提到了存储蹦床所需的一些存储量，这取决于平台。我的问题是，我如何确定需要多少？我找到了 this example
llvm - LLVM 中的抽象解释
我需要使用抽象解释来使用 LLVM 进行一些分析。这可能吗？或者我需要更轻松地使用分析工具。如果我可以通过 LLVM 做到这一点，哪些类将帮助我从原始源代码中制定语句以获取变量之间的关系(以及每个变量
llvm - LLVM 的整数溢出捕获？
我正在创建一种静态编译的编程语言，并使用 LLVM 作为其后端。我希望我的语言在发生整数溢出时陷入/崩溃。我知道类似 llvm.sadd.with.overflow 的事情，但我认为这不是最佳/有效
llvm - LLVM tablegen中的字段关键字是什么意思？
我正在尝试学习 LLVM tablegen。 http://llvm.org/docs/TableGen/LangRef.html表明 field关键字存在但不解释其含义。有人知道这是什么意思吗？我
llvm - 如何将生成的 llvm::Module 的 LLVM-IR 代码存储到字符串中？
Fibonacci LLVM 示例使用 errs() getIR() ) 我一直在搜索 llvm::Module Class Reference并没有得到任何帮助。 Fibonacci.cpp 的一部
llvm - 在 llvm IR 中找到 llvm.pow.f64
我想在 llvm IR 中找到对 llvm.pow.f64 函数的所有函数调用。请建议我一个方法来做到这一点。最佳答案嗯，这是一个基本的 FunctionPass找到所有对函数的调用: class
llvm - 如何删除未使用的 basicblocks llvm
我正在尝试从 llvm 中间代码中删除未使用的 block 。首先，我通过从入口 basicblock 开始并从它们的终止符指令添加所有 basicblock 后继者来构建可访问的 basicblo
llvm - 在 LLVM 中查找指令的后继列表
我想获取 llvm 中每条指令的后继列表。如果我没理解错的话，对于除了branch(br)之外的所有指令，后继指令就是下一条。但是对于分支指令来说有点棘手。例如，如果我有以下 C 代码: int m
llvm - 我如何解析 LLVM IR
我有文本格式的 LLVM IR 代码。我想做的是能够解析它并修改该代码。是否有可以帮助解析 LLVM IR 代码的 API？我的系统中应该有哪些库？此刻我有clang编译器也安装了 LLVM，因为我可
llvm - getelementptr 类型后的预期逗号。 LLVM
(1) @str = private constant [13 x i8] c"Hello World\0A\00" (2) define i32 @main(){ (3) %r2 = getelem
llvm - 在 llvm 中创建新函数
如果我有一组基本块和边，我需要为它们创建一个具有新入口和端点的新函数。我可以直接在 LLVM 中创建它吗，就像 createFunction(F) 一样然后 F.insert(bb, edges)其
llvm - 在基于 LLVM 的编译器中如何处理符号表？
我通过教程使用 LLVM http://llvm.org/releases/3.1/docs/tutorial/ 编写玩具编译器但是关于符号表处理的内容并不多。有一个命令 llvm-nm 显示符号
llvm - 在 LLVM 中向函数添加参数
我希望编写一个 LLVM 传递两个 i32 类型的参数来选择函数。我的第一次尝试(如下所示)失败了: bool MyFunctionPass::runOnFunction(Function &f) {

首页

博学

6Ren·AI

商城

c++ - LLVM IR : Identifying Variables with Metadata Nodes