gpt4 book ai didi

c - 如何使用 libelf 为我自己的编译器生成 ELF 文件?

转载 作者:太空狗 更新时间:2023-10-29 16:56:04 25 4
gpt4 key购买 nike

我已经为我正在编写的更简单的编译器生成了代码,我想知道如何将该代码放入 ELF 文件中?

我试过使用 libelf,但我似乎无法全神贯注于如何组织表格。

我没有使用任何数据,所以我假设我需要的只是一个 .text 部分。

如果我有生成的 x86 代码的缓冲区,我将如何创建一个仅包含可运行的简单 .text 部分的 ELF 文件?

最佳答案

简答

你不能!

您正在寻找的功能实际上是称为“链接器”的构建工具的一部分。尽管除了一些 Unresolved 符号错误外,它会不时抛出它的存在,但它的存在常常被忽视,它是任何构建链中最重要的组件之一。

长答案

这里有一些关于如何以某种方式让二进制文件运行的想法。

限制

下面描述的任何方法只有在以下情况下才有效

  • 机器代码包含任何带有绝对地址的跳转,因为将它们修补到正确的目的地需要重定位信息。

  • 程序从用作输入的二进制文件的最开头开始

    这应该很容易通过在文件开头的“正确”位置添加一个额外的(相对的)跳转指令或者通过使用二进制数据的偏移量来规避。

建议的解决方法

在一个非常简单的“自包含”包含二进制文件的情况下,仅由一堆原始机器指令给出而没有任何外部依赖性并且没有(!)任何绝对跳转指令而不是通过另一方面,使用现有的链接器可能会更容易。

给定一个由原始机器指令组成的文件(下例中的 main.bin),第一步将涉及生成一个共享对象(main.o例如)从它:

objcopy -I binary -B i386 -O elf32-i386 --rename-section .data=.text main.bin main.o

查看生成的对象符号表readelf -S :

Symbol table '.symtab' contains 5 entries:
Num: Value Size Type Bind Vis Ndx Name
0: 00000000 0 NOTYPE LOCAL DEFAULT UND
1: 00000000 0 SECTION LOCAL DEFAULT 1
2: 00000000 0 NOTYPE GLOBAL DEFAULT 1 _binary_main_bin_start
3: 0000000c 0 NOTYPE GLOBAL DEFAULT 1 _binary_main_bin_end
4: 0000000c 0 NOTYPE GLOBAL DEFAULT ABS _binary_main_bin_size

您会注意到符号 _binary_..._start , _binary_..._end_binary_..._size根据输入文件的开始、结束和大小添加。这些可用于将可执行文件的入口点传递给链接器。

ld --entry=_binary_main_bin_start main.o -o main

应该会生成您要查找的可执行文件。

手动生成

或者,您可能希望手动创建一个 elf 文件,其中只包含必要的信息以获取正在运行的可执行文件。

如果您不太熟悉 elf 格式,您可能想看看规范(可在:http://refspecs.linuxfoundation.org/ 上找到)。手册页 (man elf) 也非常详尽,因此这也可能是很好的信息来源。

为了保持最简单,我们的目标是只使用绝对必要的东西。

查看规范,您会发现在任何情况下唯一需要的组件是 elf header 。只有共享对象需要节头表,可执行文件才需要程序头表。

因为我们想要创建一个可执行文件,所以我们将只使用程序头表和一个类型为 PT_LOAD 的条目。描述可执行文件的整个内存布局。

为了满足对齐约束,进程镜像将包含二进制文件的全部内容。(来源:man elf)。

... Loadable process segments must have congruent values for p_vaddr and p_offset, modulo the page size.

话虽如此,应该很清楚为什么 elf 文件的最终布局将如下所示:

struct Binary {
Elf32_Ehdr ehdr;
Elf32_Phdr phdr;
char code[];
};

Elf32_Ehdr 和 Elf32_Phdr 的大部分字段都是固定的,因此它们已经可以在初始化程序中设置。唯一需要稍后调整的字段是描述程序头表条目中加载段的大小(.p_filesz 和 .p_memsz)的字段。

从 stdin 获取输入并写入 stdout(因此像 ./a.out <main.bin >executable 一样使用)这是可以实现所描述设置的方式:

#include <stdio.h>
#include <stddef.h>
#include <elf.h>
#include <string.h>
#include <stdlib.h>

#define BUFFER_SIZE 1024
char buffer[BUFFER_SIZE];

void *read_all (int *filesize) {
void *data = NULL;
int offset = 0;
int size = 0;

while ((size = fread (buffer, 1, sizeof (buffer), stdin)) > 0) {
if ((data = realloc (data, offset + size)) == NULL)
exit (-1);
memcpy (data + offset, buffer, size);
offset += size;
}
*filesize = offset;
return data;
}


#define LOAD_ADDRESS 0x8048000

struct Binary {
Elf32_Ehdr ehdr;
Elf32_Phdr phdr;
char code[];
};

int main (int argc, char *argv[]) {

void *code;
int code_size;

struct Binary binary = {
/* ELF HEADER */
.ehdr = {
/* general */
.e_ident = {
ELFMAG0, ELFMAG1, ELFMAG2, ELFMAG3,
ELFCLASS32,
ELFDATA2LSB,
EV_CURRENT,
ELFOSABI_LINUX,
},
.e_type = ET_EXEC,
.e_machine = EM_386,
.e_version = EV_CURRENT,
.e_entry = LOAD_ADDRESS + (offsetof (struct Binary, code)),
.e_phoff = offsetof (struct Binary, phdr),
.e_shoff = 0,
.e_flags = 0,
.e_ehsize = sizeof (Elf32_Ehdr),
/* program header */
.e_phentsize = sizeof (Elf32_Phdr),
.e_phnum = 1,
/* section header */
.e_shentsize = sizeof (Elf32_Shdr),
.e_shnum = 0,
.e_shstrndx = 0
},

/* PROGRAM HEADER */
.phdr = {
.p_type = PT_LOAD,
.p_offset = 0,
.p_vaddr = LOAD_ADDRESS,
.p_paddr = LOAD_ADDRESS,
.p_filesz = 0,
.p_memsz = 0,
.p_flags = PF_R | PF_X,
.p_align = 0x1000
}
};

if ((code = read_all (&code_size)) == NULL)
return -1;

/* fix program header */
binary.phdr.p_filesz = sizeof (struct Binary) + code_size;
binary.phdr.p_memsz = sizeof (struct Binary) + code_size;

/* write binary */
fwrite (&binary, sizeof (struct Binary), 1, stdout);
fwrite (code, 1, code_size, stdout);

free (code);

return 0;
}

关于c - 如何使用 libelf 为我自己的编译器生成 ELF 文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13319907/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com