gpt4 book ai didi

python - 如何在 Linux 上调用 Python 中的内联机器码?

转载 作者:IT王子 更新时间:2023-10-29 00:24:08 26 4
gpt4 key购买 nike

我正在尝试从 Linux 上的纯 Python 代码调用内联机器代码。为此,我将代码嵌入到字节文字中

code = b"\x55\x89\xe5\x5d\xc3"

然后调用mprotect()通过 ctypes 允许执行包含代码的页面。最后,我尝试使用ctypes 来调用代码。这是我的完整代码:

#!/usr/bin/python3

from ctypes import *

# Initialise ctypes prototype for mprotect().
# According to the manpage:
# int mprotect(const void *addr, size_t len, int prot);
libc = CDLL("libc.so.6")
mprotect = libc.mprotect
mprotect.restype = c_int
mprotect.argtypes = [c_void_p, c_size_t, c_int]

# PROT_xxxx constants
# Output of gcc -E -dM -x c /usr/include/sys/mman.h | grep PROT_
# #define PROT_NONE 0x0
# #define PROT_READ 0x1
# #define PROT_WRITE 0x2
# #define PROT_EXEC 0x4
# #define PROT_GROWSDOWN 0x01000000
# #define PROT_GROWSUP 0x02000000
PROT_NONE = 0x0
PROT_READ = 0x1
PROT_WRITE = 0x2
PROT_EXEC = 0x4

# Machine code of an empty C function, generated with gcc
# Disassembly:
# 55 push %ebp
# 89 e5 mov %esp,%ebp
# 5d pop %ebp
# c3 ret
code = b"\x55\x89\xe5\x5d\xc3"

# Get the address of the code
addr = addressof(c_char_p(code))

# Get the start of the page containing the code and set the permissions
pagesize = 0x1000
pagestart = addr & ~(pagesize - 1)
if mprotect(pagestart, pagesize, PROT_READ|PROT_WRITE|PROT_EXEC):
raise RuntimeError("Failed to set permissions using mprotect()")

# Generate ctypes function object from code
functype = CFUNCTYPE(None)
f = functype(addr)

# Call the function
print("Calling f()")
f()

此代码在最后一行出现段错误。

  1. 为什么会出现段错误? mprotect() 调用表示成功,因此应该允许我在页面中执行代码。

  2. 有没有办法修复代码?我真的可以在当前进程中用纯 Python 调用机器代码吗?

(一些进一步的评论:我并不是真的试图实现一个目标——我试图理解事情是如何工作的。我还尝试使用 2*pagesize 而不是 mprotect() 调用中的 pagesize 以排除我的 5 字节代码落在页面边界上的情况——无论如何这应该是不可能的。我使用 Python 3.1.3 进行测试...对于 :)

编辑:以下 C 版本的代码运行良好:

#include <sys/mman.h>

char code[] = "\x55\x89\xe5\x5d\xc3";
const int pagesize = 0x1000;

int main()
{
mprotect((int)code & ~(pagesize - 1), pagesize,
PROT_READ|PROT_WRITE|PROT_EXEC);
((void(*)())code)();
}

编辑 2:我在我的代码中发现了错误。线路

addr = addressof(c_char_p(code))

首先创建一个指向bytes实例code开头的ctypes char*。应用于此指针的 addressof() 不返回此指针指向的地址,而是返回指针本身的地址。

我设法找出实际获取代码开头地址的最简单方法是

addr = addressof(cast(c_char_p(code), POINTER(c_char)).contents)

对于更简单的解决方案的提示将不胜感激:)

修复这一行会使上面的代码“工作”(意味着它什么都不做而不是段错误...)。

最佳答案

我对此进行了快速调试,结果指向 code 的指针是构造不正确,内部 ctypes 的某个地方正在修改在将函数指针传递给调用代码。

这是 ffi_call_unix64() 中保存函数指针的行(我在 64 位上)进入 %r11:

57   movq    %r8, %r11               /* Save a copy of the target fn.

当我执行你的代码时,这是加载到 %r11 之前的值它尝试调用:

(gdb) x/5b $r11
0x7ffff7f186d0: -108 24 -122 0 0

这里是构造指针和调用函数的修复:

raw = b"\x55\x89\xe5\x5d\xc3"
code = create_string_buffer(raw)
addr = addressof(code)

现在,当我运行它时,我在那个地址看到了正确的字节,以及函数执行得很好:

(gdb) x/5b $r11
0x7ffff7f186d0: 0x55 0x89 0xe5 0x5d 0xc3

关于python - 如何在 Linux 上调用 Python 中的内联机器码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6143042/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com