gpt4 book ai didi

linux - Linux 中进程间如何共享代码段?

转载 作者:太空狗 更新时间:2023-10-29 11:32:00 36 4
gpt4 key购买 nike

我已经阅读了在 Linux 中 fork 新进程时发生的写时复制原则。

我也看过这样一个事实,如果一个程序的多个实例同时运行,那么在内存中只能找到程序代码的一个实例。

我想知道这是否是写时复制原则的直接结果,如果不是,确保没有不必要的程序代码副本驻留在内存中的过程是什么?

最佳答案

I was wondering whether this is a direct consequence of the copy-on-write principle or not

不,不是。 FWIW,您可以在没有 COW 的情况下共享代码段,也可以在没有共享代码段的情况下共享 COW。它是独立的。

如果通过 COW 实现共享程序代码,那么只有相关进程才能从中受益。

例如,如果进程 A fork 两次并创建进程 BC,然后 BC 在同一个二进制文件上调用七个 exec 函数之一,然后你可以说代码段是共享的,因为 COW - 因为代码段在执行过程中从不写入,并且映射为只读,那么它必须自动共享,对吧?

如果您从另一个 shell 启动同一个可执行文件怎么办? (或者其他一些不相关的进程 fork 并执行同一个程序?它不一定是一个 shell...)

如果代码段共享是 COW 的结果,在这种情况下我们不会从共享代码段中获益,因为进程是不相关的(所以没有与其他实例开始的 COW 共享页面)。

相反,代码段与内存映射文件共享。在内存中加载新的可执行文件时,调用 mmap(2) 将二进制文件的内容映射到内存中。

and if it is not, what is the process which ensures that no unnecessary copies of the program's code reside in the memory?

具体的实现细节取决于操作系统,但并不复杂。从概念上讲,mmap(2) 将文件映射到内存中,因此您只需要在底层文件表示上保留一些状态,以跟踪该文件的哪些(如果有)内存映射处于事件状态。这些信息通常保存在文件的 inode 中。 .

例如,Linux 将文件与内存地址空间与 struct inodei_mapping 字段相关联。因此,当第一次对二进制文件调用 mmap(2) 时,会分配物理内存页来保存信息,并设置该文件 inode 的 i_mapping 字段;稍后的调用将使用 i_mapping 字段并意识到有一个地址空间与此 inode 相关联,并且因为它是只读的,所以没有分配物理页面,因此所有内容最终都是共享的。请注意,每个进程的虚拟内存可能不同,尽管它引用相同的物理页面(这意味着内核至少会分配和更新每个进程的页表,但仅此而已)。

The inode structure is defined in fs.h - 我只能猜测其他 UNIX 变体以类似的方式执行此操作。

当然,只要使用相同的二进制文件,这一切都有效。如果您复制二进制文件并分别执行两个副本,出于显而易见的原因,代码段将不会共享。

关于linux - Linux 中进程间如何共享代码段?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32170711/

36 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com