gpt4 book ai didi

c - 对 __read_moSTLy、__init、__exit 宏的很好解释

转载 作者:太空狗 更新时间:2023-10-29 16:21:08 25 4
gpt4 key购买 nike

__read_moSTLy 的宏展开:

#define __read_mostly __attribute__((__section__(".data..read_mostly"))

这个来自cache.h

__初始化:

#define __init          __section(.init.text) __cold notrace

来自 init.h

__退出:

#define __exit          __section(.exit.text) __exitused __cold notrace

在网上搜索后,我没有找到任何好的解释那里发生了什么。

附加问题:我听说过各种“链接器魔法”受雇于内核开发。任何信息关于这将是美好的。

我对这些宏的作用有一些想法。像__init 应该表示函数代码可以在初始化后移除。 __read_moSTLy 用于指示数据很少写入,从而最大限度地减少缓存未命中。但我不知道他们是怎么做到的。我的意思是它们是 gcc 扩展。所以理论上它们可以通过小的用户态 C 代码来演示。

更新 1:

我尝试用任意节名称测试 __section__。测试代码:

#include <stdio.h>

#define __read_mostly __attribute__((__section__("MY_DATA")))

struct ro {
char a;
int b;
char * c;
};

struct ro my_ro __read_mostly = {
.a = 'a',
.b = 3,
.c = NULL,
};


int main(int argc, char **argv) {
printf("hello");
printf("my ro %c %d %p \n", my_ro.a, my_ro.b, my_ro.c);
return 0;
}

现在使用 __read_moSTLy 生成的汇编代码:

    .file   "ro.c"
.globl my_ro
.section MY_DATA,"aw",@progbits
.align 16
.type my_ro, @object
.size my_ro, 16
my_ro:
.byte 97
.zero 3
.long 3
.quad 0
.section .rodata
.LC0:
.string "hello"
.LC1:
.string "my ro %c %d %p \n"
.text
.globl main
.type main, @function
main:
.LFB0:
.cfi_startproc
pushq %rbp
.cfi_def_cfa_offset 16
.cfi_offset 6, -16
movq %rsp, %rbp
.cfi_def_cfa_register 6
pushq %rbx
subq $24, %rsp
movl %edi, -20(%rbp)
movq %rsi, -32(%rbp)
movl $.LC0, %eax
movq %rax, %rdi
movl $0, %eax
.cfi_offset 3, -24
call printf
movq my_ro+8(%rip), %rcx
movl my_ro+4(%rip), %edx
movzbl my_ro(%rip), %eax
movsbl %al, %ebx
movl $.LC1, %eax
movl %ebx, %esi
movq %rax, %rdi
movl $0, %eax
call printf
movl $0, %eax
addq $24, %rsp
popq %rbx
leave
.cfi_def_cfa 7, 8
ret
.cfi_endproc
.LFE0:
.size main, .-main
.ident "GCC: (GNU) 4.4.6 20110731 (Red Hat 4.4.6-3)"
.section .note.GNU-stack,"",@progbits

现在没有 __read_moSTLy 宏,汇编代码或多或少保持不变。

这是区别

--- rm.S    2012-07-17 16:17:05.795771270 +0600
+++ rw.S 2012-07-17 16:19:08.633895693 +0600
@@ -1,6 +1,6 @@
.file "ro.c"
.globl my_ro
- .section MY_DATA,"aw",@progbits
+ .data
.align 16
.type my_ro, @object
.size my_ro, 16

所以基本上只创建了一个小节,没有什么特别的。

即使是 objdump disassmbly 也没有显示出任何区别。

所以我对它们的最终结论是,链接器的工作为标有特殊名称的数据部分做一些事情。我认为 linux 内核使用某种自定义的链接描述文件来实现这些事情。

关于 __read_moSTLy 的事情之一是,可以对放置在那里的数据进行分组和管理,从而减少缓存未命中。

lkml 的某人提交了一个补丁以删除 __read_moSTLy。这引发了一场关于 __read_moSTLy 优点和缺点的有趣讨论。

这是链接:https://lkml.org/lkml/2007/12/13/477

我将发布有关 __init__exit 的进一步更新。

更新 2

这些宏 __init , __exit__read_moSTLy 放置了 data 的内容(如果是 __read_moSTLy) 和 text(在 __init__exit 的情况下)被放入自定义命名部分。这些部分由链接器使用。现在,由于各种原因,链接器未用作其默认行为,因此采用了链接器脚本来实现这些宏的目的。

可以找到如何使用自定义链接器脚本消除死代码(链接器链接到但从未执行过的代码)的背景。这个问题在嵌入式场景中非常重要。本文档讨论了如何微调链接器脚本以删除无用代码:elinux.org/images/2/2d/ELC2010-gc-sections_Denys_Vlasenko.pdf

如果是内核,可以找到初始链接描述文件 include/asm-generic/vmlinux.lds.h。这不是最终剧本。这是一种起点链接器脚本针对不同平台进行了进一步修改。

快速浏览一下这个文件,可以立即找到感兴趣的部分:

#define READ_MOSTLY_DATA(align)                     \
. = ALIGN(align); \
*(.data..read_mostly) \
. = ALIGN(align);

这部分似乎使用了“.data..readmoSTLy”部分。

您还可以找到 __init__exit 部分相关的链接器命令:

#define INIT_TEXT                           \
*(.init.text) \
DEV_DISCARD(init.text) \
CPU_DISCARD(init.text) \
MEM_DISCARD(init.text)

#define EXIT_TEXT \
*(.exit.text) \
DEV_DISCARD(exit.text) \
CPU_DISCARD(exit.text) \
MEM_DISCARD(exit.text)

链接似乎是一件很复杂的事情:)

最佳答案

GCC attributes是一种向编译器提供语言本身规范之外的指令的通用机制。

您列出的宏的常用功能是使用 __section__ attribute描述为:

The section attribute specifies that a function lives in a particular section. For example, the declaration:

extern void foobar (void) __attribute__ ((section ("bar")));

puts the function foobar in the bar section.

那么把一些东西放在一个部分里是什么意思呢?目标文件分为几个部分:.text 用于可执行机器代码,.data 用于读写数据,.rodata 用于只读data, .bss 用于初始化为零的数据等。这些部分的名称和用途是平台约定的问题,一些特殊部分只能使用 __attribute__ ( (section)) 语法。

在您的示例中,您可以猜测 .data..read_moSTLy.data 的一个子部分,用于主要读取的数据; .init.text 是一个文本(机器码)段,在程序初始化等时候运行。

在 Linux 上,决定如何处理各个部分是内核的工作;当用户空间请求exec一个程序时,它将逐段读取程序图像并适本地处理它们:.data部分被映射为读写页面,.rodata为只读,.text为只读,等等。推测.init.text会在程序启动前执行;这可以由内核或放置在程序入口点的用户空间代码完成(我猜是后者)。

如果您想查看这些属性的效果,一个好的测试是使用 -S 选项运行 gcc 以输出汇编代码,其中将包含段指令。然后,您可以使用和不使用节指令运行汇编器,并使用 objdump 或什至十六进制转储生成的目标文件以查看它有何不同。

关于c - 对 __read_moSTLy、__init、__exit 宏的很好解释,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11505681/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com