gpt4 book ai didi

gcc - MinGW 的 ld 无法对非 PE 输出文件执行 PE 操作

转载 作者:行者123 更新时间:2023-12-04 14:16:36 29 4
gpt4 key购买 nike

我知道还有其他一些类似的问题,无论是否是 StackOverflow。我为此研究了很多,但仍然没有找到单一的解决方案。
我正在做一个操作系统作为一个副项目。我一直在做汇编,但现在我想加入 C 代码。
为了测试,我制作了这个汇编代码文件(称为 test.asm):

[BITS 32]

GLOBAL _a

SECTION .text

_a:
jmp $

然后我制作了这个 C 文件(称为 main.c):
extern void a(void);
int main(void)
{
a();
}

为了链接,我使用了这个文件(称为 make.bat):
"C:\minGW\bin\gcc.exe"  -ffreestanding -c -o c.o main.c
nasm -f coff -o asm.o test.asm
"C:\minGW\bin\ld.exe" -Ttext 0x100000 --oformat binary -o out.bin c.o asm.o

pause

我一直在研究多年,我仍然在努力寻找答案。我希望这不会被标记为重复。我承认存在类似的问题,但都有不同的答案,没有一个对我有用。

问题: 我究竟做错了什么?

最佳答案

旧的 MinGW 版本存在“ld”根本无法创建非 PE 文件的问题。

也许当前版本有同样的问题。

解决方法是使用“ld”创建一个 PE 文件,然后使用“objcopy”将 PE 文件转换为二进制、HEX 或 S19。

- - 编辑 - -

再次思考这个问题,我看到两个问题:

正如我已经说过的,某些版本的“ld”在创建“二进制”输出(而不是“PE”、“ELF”或使用的任何格式)时存在问题。

代替:

ld.exe --oformat binary -o file.bin c.o asm.o

您应该使用以下顺序来创建二进制文件:
ld.exe -o file.tmp c.o asm.o
objcopy -O binary file.tmp file.bin

这将创建一个名为“binary.tmp”的“.exe”文件;然后“objcopy”将从“.exe”文件中创建原始数据。

第二个问题是链接本身:

“ld”采用类似“.exe”的文件格式 - 即使输出文件是二进制文件。这意味着 ...
  • ...您甚至无法确定“main.o”的目标代码是否真的位于结果目标代码的第一个地址。 "ld"也可以将 "a()"的代码放在 "main()"之前,甚至可以将 "internal"代码放在 "a()"和 "main()"之前。
  • ...寻址的工作方式略有不同,这意味着如果您做错了什么,将创建大量填充字节(可能在文件的开头!)。

  • 我看到的唯一可能性是创建一个“链接器脚本”(有时称为“链接器命令文件”)并在汇编代码中创建一个特殊部分(因为我通常使用除“nasm”之外的另一个汇编程序我不知道语法是否这里是正确的):
    [BITS 32]
    GLOBAL _a
    SECTION .entry
    jmp _main
    SECTION .text
    _a:
    jmp $

    在链接描述文件中,您可以指定哪些部分以何种顺序出现。指定“.entry”是文件的第一部分,这样您就可以确定它是文件的第一条指令。

    在链接描述文件中,您还可以将多个部分(例如“.entry”、“.text”和“.data”)合并为一个部分。这很有用,因为在 PE 文件中,节通常是 0x1000 字节对齐的!如果您不将多个部分合并为一个,您将在这些部分之间获得大量 stub 字节!

    不幸的是,我不是链接器脚本的专家,所以我无法帮助你太多。

    使用“-Ttext”也有问题:

    在 PE 文件中,节的实际地址计算为“图像基址”+“相对地址”。 “-Ttext”参数只会影响“相对地址”。因为第一部分的“相对地址”在 Windows 中通常固定为 0x1000,所以“-Ttext 0x2000”只会在第一部分的开头填充 0x1000 stub 字节。但是,您根本不会影响“.text”的起始地址——您只在“.text”部分的开头填充 stub 字节,以便第一个 有用字节位于 0x2000。 (也许某些“ld”版本的行为有所不同。)

    如果您希望文件的第一部分位于地址 0x100000,则应在链接描述文件中使用等效于“-Ttext 0x1000”的内容(如果使用链接描述文件,则不使用 -Ttext)并定义“图像库”到 0xFF000:
    ld.exe -T linkerScript.ld --image-base 0xFF000 -o binary.tmp a.o main.o

    “.text”部分的内存地址将为 0xFF000 + 0x1000 = 0x100000。

    (“objcopy”生成的二进制文件的第一个字节将是第一部分的第一个字节——代表内存地址0x100000。)

    关于gcc - MinGW 的 ld 无法对非 PE 输出文件执行 PE 操作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30939593/

    29 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com