gpt4 book ai didi

c - 引导加载程序如何在二进制文件中找到 DS 部分

转载 作者:行者123 更新时间:2023-11-30 15:14:06 26 4
gpt4 key购买 nike

我正在研究内核开发。我有一个引导加载程序,可以将二进制文件加载到内存并运行它。二进制文件由C语言生成,构建过程如下:

i686-elf-gcc -c main.c -o main.o -std=gnu99 -ffreestanding -Wall -Wextra
i686-elf-gcc -m32 -Ttext 0x8000 -o startup.elf -ffreestanding -O2 -nostdlib main.o -lgcc
objcopy -O binary startup.elf startup.bin

i686-elf-gcc 是我的 GCC 交叉编译器。由于我的bootloader有点大,而且我认为这和问题没有关系,所以这里就不展示了。我的引导加载程序将准备保护模式,启用 A20,并为 C 二进制文件设置 4GB 代码/数据描述符表。 C 二进制文件工作正常。我让它清洁屏幕,并打印“Hello World!”,它起作用了。问题是,如果我的 main.c 包含初始化数据部分,它就不能正常工作。例如,如果我将默认的 (X, Y) 坐标设置为 (10, 10),“Hello World”仍然显示在最左上角。问题是当我将 elf 文件转换为二进制文件时,二进制执行程序可以使用信息(10, 10)。

当我使用hexdump检查二进制文件时,我可以找到数据值。例如,如果我有

uint16_t ds = 0x1234;

我可以在二进制文件中看到0x1234,看起来它并不位于代码部分,而是位于另一个部分。 (例如代码段从 0x0000 开始,但 0x1234 位于很远的 0x2000 处)而且我还发现“main”函数希望将数据部分保存在堆栈中,以便它可以引用。所以我的引导加载程序需要从二进制文件中获取数据部分,并将其推送到堆栈。但是如何找到二进制文件中数据部分的位置和大小呢?如果我的解决方案是错误的,那么如何让引导加载程序加载包含数据部分的可执行文件?

最佳答案

我的问题已经解决了。我的引导加载程序仅从 CD 复制了 1 个扇区(2k 字节),而我的 C 程序大于 2k,因此未复制初始化值。

为了让问题更清楚,我想更好地解释一下。这是一个例子:

baibin@baibin-Z620:~/workspace/tmp$ cat main.c
#include <stdint.h>

uint16_t ds = 0x1111;
void _start(void) {
ds++;
}
baibin@baibin-Z620:~/workspace/tmp$ cat Makefile
all:
i686-elf-gcc -c main.c -o main.o -std=gnu99 -ffreestanding -Wall -Wextra
i686-elf-gcc -m32 -Ttext 0x8000 -o startup.elf -ffreestanding -nostdlib main.o -lgcc
objcopy -O binary startup.elf startup.bin
clean:
@rm main.o startup.*
baibin@baibin-Z620:~/workspace/tmp$ objdump -s -S startup.elf

startup.elf: file format elf32-i386

Contents of section .text:
8000 5589e50f b7055090 000083c0 0166a350 U.....P......f.P
8010 90000090 5dc3 ....].
Contents of section .eh_frame:
8018 14000000 00000000 017a5200 017c0801 .........zR..|..
8028 1b0c0404 88010000 1c000000 1c000000 ................
8038 c8ffffff 16000000 00410e08 8502420d .........A....B.
8048 0552c50c 04040000 .R......
Contents of section .data:
9050 1111 ..
Contents of section .comment:
0000 4743433a 2028474e 55292035 2e322e30 GCC: (GNU) 5.2.0
0010 00 .

Disassembly of section .text:

00008000 <_start>:
8000: 55 push %ebp
8001: 89 e5 mov %esp,%ebp
8003: 0f b7 05 50 90 00 00 movzwl 0x9050,%eax
800a: 83 c0 01 add $0x1,%eax
800d: 66 a3 50 90 00 00 mov %ax,0x9050
8013: 90 nop
8014: 5d pop %ebp
8015: c3 ret
baibin@baibin-Z620:~/workspace/tmp$ hexdump -C startup.bin
00000000 55 89 e5 0f b7 05 50 90 00 00 83 c0 01 66 a3 50 |U.....P......f.P|
00000010 90 00 00 90 5d c3 00 00 14 00 00 00 00 00 00 00 |....]...........|
00000020 01 7a 52 00 01 7c 08 01 1b 0c 04 04 88 01 00 00 |.zR..|..........|
00000030 1c 00 00 00 1c 00 00 00 c8 ff ff ff 16 00 00 00 |................|
00000040 00 41 0e 08 85 02 42 0d 05 52 c5 0c 04 04 00 00 |.A....B..R......|
00000050 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 |................|
*
00001050 11 11 |..|
00001052
baibin@baibin-Z620:~/workspace/tmp$

正如您所看到的,在加载主程序之后,DS预计位于 0x9050 中。如果我的二进制文件仅从 0x0000 加载到 0x0050,则 DS 将无法正确初始化。

<小时/>

Craig Estey 发表评论并提出问题“您是如何发现这个问题的?另外,您是如何解决这个问题的?在您发表回答之前,我一直在考虑数据部分重定位问题。如果您更改了构建命令,为了帮助将来遇到类似问题的其他人,如果您可以编辑您的答案并添加更改后的命令,那就太好了

这是我对 Craig Estey 问题的答复:

我将验证我的 C 可执行文件在引导加载程序加载后是否正常工作。最简单的方法是在屏幕上显示一些内容。首先,我写了一个非常简单的print(),如下所示:

void print() {
uint8_t x = 80 / 2;
uint8_t y = 25 / 2;
// print hello world;
}

效果很好。屏幕中间打印“hello world”。然后我改进这个功能。我将 x, y 作为静态值移到外面。

uint8_t x = 80 / 2;
uint8_t y = 25 / 2;
void print() {
// print hello world;
}

我的程序开始出现三次错误。为什么我无法定义 .ds 数据?我使用 objdumphexdump 来检查可执行文件发生了什么。我发现hexdump可以显示二进制中的x,y值,并且偏移量与读取指令相匹配。所以我怀疑我的引导加载程序是否有错误?

是的,我的引导加载程序确实有一个错误。它只读取 CD 上的 1 个扇区,因此这些值未被复制。 CD 的扇区大小为 2k,但 BIOS 只能读取第一个扇区的 512 字节。更重要的是,如果我让x = 0,y = 0,并将它们作为静态值放在外面,你认为会发生什么?天啊,又犯三错了!

x、y将从.ds转为.bss,并且不会包含在elf和二进制中。 (elf只有大小,没有初始化值,因为默认值为0)。

要生成可用的二进制文件,您需要指定如下选项:

objcopy -O binary --set-section-flags .bss=alloc,load,contents startup.elf startup.bin

关于c - 引导加载程序如何在二进制文件中找到 DS 部分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34181799/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com