gpt4 book ai didi

c - 函数插入,标记 C 函数总是使用符号 stub 而不是直接调用

转载 作者:行者123 更新时间:2023-12-01 08:56:13 26 4
gpt4 key购买 nike

我正在尝试解决的一个有趣的学术问题:

在 C 代码中,我试图在运行时动态重新绑定(bind)符号,很像 Facebook's fishhook repo重新绑定(bind)函数符号。我主要关心的是,追踪在 Mach-O 可执行文件的 __DATA.__la_symbol_ptr 部分中引用的符号。使用 fishhook 实现,您可以提供替换原始函数的新函数、一个指示您要替换哪个函数的字符串,以及一个全局函数指针,它将代替调用原始的、被替换的函数。

例如,取自 fishhook 存储库中的 README...

static int (*orig_close)(int);
int my_close(int fd) {
return orig_close(fd);
}

...然后在 main

rebind_symbols((struct rebinding[1]){{"close", my_close, (void *)&orig_close}}, 1);

这太棒了,但我希望能够在我的模块中将所有对 my_close 的调用与对 close 的所有调用完全切换,反之亦然。例如,我希望我的实现看起来像这样,而不是指向原始 close 的全局函数指针:

int my_close(int fd) {
return my_close(fd);
}

不幸的是,由于这个符号在同一个模块中被引用,这个符号将通过直接调用而不是符号 stub 来调用。这是从 main

调用此函数时的程序集
0x100001e00 <+0>:  push   rbp
0x100001e01 <+1>: mov rbp, rsp
0x100001e04 <+4>: sub rsp, 0x20
0x100001e08 <+8>: xor eax, eax
0x100001e0a <+10>: mov dword ptr [rbp - 0x4], 0x0
0x100001e11 <+17>: mov dword ptr [rbp - 0x8], edi
0x100001e14 <+20>: mov qword ptr [rbp - 0x10], rsi
0x100001e18 <+24>: mov edi, eax
0x100001e1a <+26>: call 0x100001da0 ; my_close at main.m:42
0x100001e1f <+31>: xor edi, edi
0x100001e21 <+33>: mov dword ptr [rbp - 0x14], eax
0x100001e24 <+36>: mov eax, edi
0x100001e26 <+38>: add rsp, 0x20
0x100001e2a <+42>: pop rbp
0x100001e2b <+43>: ret

好吧,修复起来很简单,我可以使用汇编程序指令将函数标记为弱函数,并使用弱引用来关闭编译器以防止潜在的堆栈溢出。将 my_close 更改为:

static int f(int) __attribute__ ((weakref ("my_close")));

__attribute__((weak))
int my_close(int fd) {
return f(fd);
}

然后将在 main 中生成以下程序集:

0x100001df0 <+0>:  push   rbp
0x100001df1 <+1>: mov rbp, rsp
0x100001df4 <+4>: sub rsp, 0x20
0x100001df8 <+8>: xor eax, eax
0x100001dfa <+10>: mov dword ptr [rbp - 0x4], 0x0
0x100001e01 <+17>: mov dword ptr [rbp - 0x8], edi
0x100001e04 <+20>: mov qword ptr [rbp - 0x10], rsi
0x100001e08 <+24>: mov edi, eax
0x100001e0a <+26>: call 0x100001e5e ; symbol stub for: my_close
0x100001e0f <+31>: xor edi, edi
0x100001e11 <+33>: mov dword ptr [rbp - 0x14], eax
0x100001e14 <+36>: mov eax, edi
0x100001e16 <+38>: add rsp, 0x20
0x100001e1a <+42>: pop rbp
0x100001e1b <+43>: ret

所以这是我坚持的部分:当在 my_close 中引用 my_close 时,它总是导致直接调用。例如:这是 my_close

的程序集
0x100001dd0 <+0>:  push   rbp
0x100001dd1 <+1>: mov rbp, rsp
0x100001dd4 <+4>: sub rsp, 0x10
0x100001dd8 <+8>: mov dword ptr [rbp - 0x4], edi
0x100001ddb <+11>: mov edi, dword ptr [rbp - 0x4]
0x100001dde <+14>: call 0x100001dd0 ; <+0> at main.m:44
0x100001de3 <+19>: add rsp, 0x10
0x100001de7 <+23>: pop rbp
0x100001de8 <+24>: ret

my_close 中调用时,是否有任何我可以使用(我错过了)的汇编器指令告诉 my_close 被视为 stub ?是的,我知道我可以使用 dlsym 获取原件,但我很固执:]

最佳答案

根据我的评论,这是一种可能的实现方式,其中 my_call 被声明为全局函数指针类型。

这种方法意味着对符号的每个引用实际上是对全局变量(函数指针)的引用,可以随时轻松更新。

将其放在 my_close.h 中:

extern volatile int (*my_close)(int);

void set_my_close(int (*func)(int));

并将此 my_call.c 添加到您的项目中(大部分未经测试):

#if defined(__unix__) || defined(__APPLE__) || defined(__linux__)
#ifndef _GNU_SOURCE
#define _GNU_SOURCE
#endif
#endif /* __unix__ */

/* Select the correct compiler builtin method. */
#if defined(__has_builtin)

#if __has_builtin(__atomic_exchange_n)
#define EXCHANGE(...) __atomic_exchange_n(__VA_ARGS__, __ATOMIC_ACQ_REL)

#elif __has_builtin(__sync_swap)
#define EXCHANGE(...) __sync_swap(__VA_ARGS__)

#else
#error Required builtin "__sync_swap" or "__atomic_exchange_n" missing from compiler.
#endif /* defined(__has_builtin) */

#elif __GNUC__ > 3
#define EXCHANGE(...) __sync_fetch_and_or(__VA_ARGS__)

#else
#error Required builtin "__sync_swap" or "__atomic_exchange_n" not found.
#endif

volatile int (*my_close)(int);

void set_my_close(int (*func)(int)) { EXCHANGE(&my_close, func); }

这使得更新 my_close 并将其动态路由到不同的函数变得容易。

...

另一个选项,它利用 C11 原子操作(据说更便携)可能需要 my_close.h 包含在任何调用 my_close 的源文件中(以确保atomic_load 被调用)。

以下是未经测试的:

my_close.h 中:

#include <stdatomic.h>

extern volatile _Atomic int (*my_close)(int);

inline void set_my_close(int (*func)(int)) { atomic_store(&my_close, func); }

#define my_close(fd) ((atomic_load(&my_close))( fd ))

my_close.c 中:

#include "my_close.h"

#undef my_close

volatile _Atomic int (*my_close)(int);

我没有在我的计算机上运行或 lint 任何代码,因此请仅将其视为大纲。

关于c - 函数插入,标记 C 函数总是使用符号 stub 而不是直接调用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46396381/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com