gpt4 book ai didi

c++ - 关于访问 %gs

转载 作者:太空宇宙 更新时间:2023-11-04 13:01:47 27 4
gpt4 key购买 nike

我读过另一个discussion .

我知道%gs是段寄存器,存放段描述符。操作系统获取段描述符并计算物理地址。大多数时候,段描述符对程序员来说是不透明的。我可以做一些技巧,比如拦截系统调用 set_thread_area并获取 %gs 的值。

但他们所说的大部分内容对我来说仍然过于抽象。所以我尝试构建一个简单的代码来表达我的问题。我希望有人能告诉我我在示例中犯了什么错误。

首先,我写了一个 pthread 代码如下。

__thread int Sum = 123; // declare as __thread type. 123 = 0x7b

void *show_msg( void *ptr ) {
for( int x = 5 ; x > 0 ; --x){
printf("%d\n", Sum++ ); // print the value of Sum and plus 1
sleep(1);
}
pthread_exit((void *)1234);
}

int main(){
pthread_t thread1;
pthread_t thread2;
char *message1 = "Thread 1";
char *message2 = "Thread 2";

pthread_create(&thread1, NULL , show_msg , (void*) message1);
pthread_create(&thread2, NULL , show_msg , (void*) message2);
pthread_join( thread1, &ret);
pthread_join( thread2, &ret);

return 0;
}

我用 gcc test.cpp -lpthread -static -m32 编译它

然后我做objdump -D a.out .我只发布了我无法理解的部分结果。因为a.out是一个静态链接的二进制文件,我可以获得一些初始化代码,如 <__libc_setup_tls>

08052510 <__libc_setup_tls>:
...
805262c: mov $0xf3,%eax ; syscall number 0xf3 is set_thread_area
8052631: mov %ebx,0x24(%esp)
805262c: lea 0x20(%esp),%ebx ; %ebx stores a pointer to struct user_desc
...
8052651: int $0x80

...

080496d4<_Z8show_msgPv>:
...
80496f0: mov %gs:0xffffffd0,%eax
80496f6: lea 0x1(%eax),%edx
80496f9: mov %edx,%gs:0xffffffd0
...

我用 a.out 运行 gdb 并将断点设置在 0x805262c 和 0x80496f0。

805262c: lea 0x20(%esp),%ebx ; %ebx stores a pointer to struct user_desc

我执行这条指令后,%ebx的值为0xffffccd0。我知道值 0xffffccd0 是 user_desc 的指针, 内存 0xffffccd4 存储了 %gs 的值, 即 0x080fd840。

然后我继续调试。

80496f0: mov %gs:0xffffffd0,%eax

我知道 %gs 的值0x63,这是段描述符号,指向0x080fd840。所以我可以计算出 %gs:0xffffffd0 的值是0x080fd810 . 0x080fd810 的内存存放的是0x7b。当我得到这个值时我很兴奋,因为 0x7b 是十六进制值 123,这是全局变量的初始值 Sum .

但是当我执行以下指令时,有些事情很奇怪。

80496f6: lea 0x1(%eax),%edx ; yield %edx = 0x7c
80496f9: mov %edx,%gs:0xffffffd0 ; store 0x7c to %gs:0xffffffd0(????)

加法结果不存储到0x080fd810 , %gs:0xffffffd0 的内存地址.但是这个线程的下一次迭代可以从%gs:0xffffffd0得到0x7c。 !!!

我使用 strace -c ./a.out 跟踪系统调用.显示来电号码set_thread_area只有 1。即 %gs只设置一次。

我认为当线程上下文切换发生时,操作系统会做一些改变。谁能给我更多细节并告诉我为什么我的想法在这种情况下是错误的?

最佳答案

操作系统将处理线程本地存储 (TLS) 的内存,并保持 %gs [或其基地址] 在下一个线程加载时更新,并且在新线程时分配内存 [1]已创建。

编译器和链接器负责计算 TLS 的大小和各自的偏移量 - 在这种情况下,实现似乎使用了与基地址的负偏移量,因此您的特定变量位于 -0x30 从 %gs 开始。

[当你说“我知道 %gs 是 0x080fd840 时,你的意思是该段的基地址就是那个值,对吗?因为 %gs 将是 x86 描述符表中的 16 位索引]

[1] 这可能意味着操作系统只是为 TLS 提供了一个虚拟地址,但是物理内存的实际分配是“根据需要”发生的,就像可执行文件、共享库或大内存一样分配完成。

关于c++ - 关于访问 %gs,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33708206/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com