linux - LLVM 上的系统调用/sysenter-6ren

linux - LLVM 上的系统调用/sysenter

转载作者：IT王子更新时间：2023-10-29 00:18:39

24

4

如何编写发出特定于体系结构的系统调用指令所需的 LLVM 位码？

更具体地说，clang 支持内联汇编，并且明确支持发出系统调用(否则无法编译 libc 和 vdso)。翻译是如何为此工作的，我怎样才能让它重现这种行为？

我理解 LLVM 本身可能无法理解各种体系结构使用的调用接口(interface)和寄存器调度，这些调用接口(interface)和寄存器调度以足够高的方式在 LLVM 字节码中表达(例如，可能在其他地方填写)。但是，显然有一个可以添加此信息的阶段。

我该怎么做，从“带有内联汇编的 C 源代码”之后的任何阶段开始？

一个令人满意的答案将包括一个如何调用五参数 int 0x80 系统调用的示例。我选择了五个，因为这需要溢出到堆栈，我选择 int 0x80 因为它很容易理解并且在最常见的平台上。

最佳答案

因为 exa 悬赏，所以在这里发布一个答案。

我意识到在 Ross Ridge 的评论之后问这个问题有些愚蠢，有些人在玩弄 clang。

假设我们有以下程序，它使用内联汇编直接调用write()。

#include <stdio.h>
int main(void)
{
    char *buf = "test\n";
    ssize_t n;
    asm volatile (
        "movl $0x00000002, %%edi\n"  /* first argument == stderr */
        "movl $0x00000006, %%edx\n"  /* third argument == number of bytes */
        "movl $1, %%eax\n"  /* syscall number == write on amd64 linux */
        "syscall\n"
        : "=A"(n)         /* %rax: return value */
        : "S"(buf));      /* %rsi: second argument == address of data to write */
    return n;
}

我们可以用 gcc 或 clang 编译它并得到大致相同的结果。

$ gcc -o syscall.gcc syscall.c
$ clang -o syscall.clang syscall.c
$ ./syscall.gcc
test
$ ./syscall.clang
test

如果我们希望查看用于发出此代码的确切 LLVM 指令，我们可以简单地使用 -emit-llvm 标志。如您所见，有一个 call i64 asm sideeffect 行，其中包含完整的内联汇编字符串。

$ clang -S -emit-llvm syscall.c
$ cat syscall.ll
; ModuleID = 'syscall.c'
target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128"
target triple = "x86_64-pc-linux-gnu"

@.str = private unnamed_addr constant [6 x i8] c"test\0A\00", align 1

; Function Attrs: nounwind uwtable
define i32 @main() #0 {
  %1 = alloca i32, align 4
  %buf = alloca i8*, align 8
  %n = alloca i64, align 8
  store i32 0, i32* %1
  store i8* getelementptr inbounds ([6 x i8]* @.str, i32 0, i32 0), i8** %buf, align 8
  %2 = load i8** %buf, align 8
  %3 = call i64 asm sideeffect "movl $$0x00000002, %edi\0Amovl $$0x00000006, %edx\0Amovl $$1, %eax\0Asyscall\0A", "=A,{si},~{dirflag},~{fpsr},~{flags}"(i8* %2) #1, !srcloc !1
  store i64 %3, i64* %n, align 8
  %4 = load i64* %n, align 8
  %5 = trunc i64 %4 to i32
  ret i32 %5
}

attributes #0 = { nounwind uwtable "less-precise-fpmad"="false" "no-frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" "no-infs-fp-math"="false" "no-nans-fp-math"="false" "stack-protector-buffer-size"="8" "unsafe-fp-math"="false" "use-soft-float"="false" }
attributes #1 = { nounwind }

!llvm.ident = !{!0}

!0 = metadata !{metadata !"Ubuntu clang version 3.5-1ubuntu1 (trunk) (based on LLVM 3.5)"}
!1 = metadata !{i32 134, i32 197, i32 259, i32 312}

关于linux - LLVM 上的系统调用/sysenter，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/26053553/

24

4

0

文章推荐： c - AF_UNIX 套接字开销？

文章推荐： MySQL数据类型从varchar到float的转换

文章推荐： mysql - 使用 mysql 中的 select 语句替换 sql 中的空值？

llvm - 无法从其源代码构建 LLVM
我指的是 https://llvm.org/docs/GettingStarted.html从其源代码构建 LLVM。我正在使用 Ubuntu 18.04。 $ cmake -G Ninja -DCM
llvm - LLVM 操作数的遍历
使用 ModulePass，我的目标是向上遍历 SSA 图:从一个具有 0..2 个操作数的语句(大多数操作码属于该语句)开始，我想找出两件事: 操作数是元数据/常量(简单:只需尝试转换为常量类型)还
llvm - LLVM 做了哪些类型的优化以及它的前端必须自行实现哪些类型的优化？
注意:我注意到 this question与这个问题有很大关系，所以如果您对我的问题感兴趣，那么您一定要阅读另一个问题及其答案。我可以想到一些 OOP 语言前端可以做的优化，例如创建临时变量来保存来
llvm - llvm 中的自动矢量化
我正在尝试使用 clang-3.2 创建自动矢量化代码从这里的幻灯片 - http://llvm.org/devmtg/2012-04-12/Slides/Hal_Finkel.pdf 我应该能够使
llvm - 在新的pass中使用现有pass生成的信息，LLVM
我想问的是，我们可以将现有pass生成的信息转化为新pass吗？如果是，那么如何？例如 -loops 给出了自然循环信息，所以我们可以通过调用它来将这些信息用于新的传递。最佳答案您可以通过覆盖
llvm - LLVM 中数组索引方式的区别
在 LLVM IR 中，当我想从一个数组中获取一个值时，似乎有三种方法可以做到这一点:使用 extractvalue、使用 extractelement 和使用 getelementptr 然后加载。
llvm - LLVM IR是否有调试器？
我想逐步介绍一下我生成的LLVM IR代码。就llc和lli而言，该代码在语法上是有效的并且类型有效，但是结果不是我所期望的。这些块足够大，以至于我无法简单地读取该错误就无法成功完成，并且我很难制作
llvm - LLVM 蹦床需要多少空间
我想弄清楚如何使用 trampoline intrinsics在 LLVM 中。该文档提到了存储蹦床所需的一些存储量，这取决于平台。我的问题是，我如何确定需要多少？我找到了 this example
llvm - LLVM 中的抽象解释
我需要使用抽象解释来使用 LLVM 进行一些分析。这可能吗？或者我需要更轻松地使用分析工具。如果我可以通过 LLVM 做到这一点，哪些类将帮助我从原始源代码中制定语句以获取变量之间的关系(以及每个变量
llvm - LLVM 的整数溢出捕获？
我正在创建一种静态编译的编程语言，并使用 LLVM 作为其后端。我希望我的语言在发生整数溢出时陷入/崩溃。我知道类似 llvm.sadd.with.overflow 的事情，但我认为这不是最佳/有效
llvm - LLVM tablegen中的字段关键字是什么意思？
我正在尝试学习 LLVM tablegen。 http://llvm.org/docs/TableGen/LangRef.html表明 field关键字存在但不解释其含义。有人知道这是什么意思吗？我
llvm - 如何将生成的 llvm::Module 的 LLVM-IR 代码存储到字符串中？
Fibonacci LLVM 示例使用 errs() getIR() ) 我一直在搜索 llvm::Module Class Reference并没有得到任何帮助。 Fibonacci.cpp 的一部
llvm - 在 llvm IR 中找到 llvm.pow.f64
我想在 llvm IR 中找到对 llvm.pow.f64 函数的所有函数调用。请建议我一个方法来做到这一点。最佳答案嗯，这是一个基本的 FunctionPass找到所有对函数的调用: class
llvm - 如何删除未使用的 basicblocks llvm
我正在尝试从 llvm 中间代码中删除未使用的 block 。首先，我通过从入口 basicblock 开始并从它们的终止符指令添加所有 basicblock 后继者来构建可访问的 basicblo
llvm - 在 LLVM 中查找指令的后继列表
我想获取 llvm 中每条指令的后继列表。如果我没理解错的话，对于除了branch(br)之外的所有指令，后继指令就是下一条。但是对于分支指令来说有点棘手。例如，如果我有以下 C 代码: int m
llvm - 我如何解析 LLVM IR
我有文本格式的 LLVM IR 代码。我想做的是能够解析它并修改该代码。是否有可以帮助解析 LLVM IR 代码的 API？我的系统中应该有哪些库？此刻我有clang编译器也安装了 LLVM，因为我可
llvm - getelementptr 类型后的预期逗号。 LLVM
(1) @str = private constant [13 x i8] c"Hello World\0A\00" (2) define i32 @main(){ (3) %r2 = getelem
llvm - 在 llvm 中创建新函数
如果我有一组基本块和边，我需要为它们创建一个具有新入口和端点的新函数。我可以直接在 LLVM 中创建它吗，就像 createFunction(F) 一样然后 F.insert(bb, edges)其
llvm - 在基于 LLVM 的编译器中如何处理符号表？
我通过教程使用 LLVM http://llvm.org/releases/3.1/docs/tutorial/ 编写玩具编译器但是关于符号表处理的内容并不多。有一个命令 llvm-nm 显示符号
llvm - 在 LLVM 中向函数添加参数
我希望编写一个 LLVM 传递两个 i32 类型的参数来选择函数。我的第一次尝试(如下所示)失败了: bool MyFunctionPass::runOnFunction(Function &f) {

首页

博学

6Ren·AI

商城

linux - LLVM 上的系统调用/sysenter