- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我已经阅读了在 Linux 中 fork 新进程时发生的写时复制原则。
我也看过这样一个事实,如果一个程序的多个实例同时运行,那么在内存中只能找到程序代码的一个实例。
我想知道这是否是写时复制原则的直接结果,如果不是,确保没有不必要的程序代码副本驻留在内存中的过程是什么?
最佳答案
I was wondering whether this is a direct consequence of the copy-on-write principle or not
不,不是。 FWIW,您可以在没有 COW 的情况下共享代码段,也可以在没有共享代码段的情况下共享 COW。它是独立的。
如果通过 COW 实现共享程序代码,那么只有相关进程才能从中受益。
例如,如果进程 A
fork 两次并创建进程 B
和 C
,然后 B
和C
在同一个二进制文件上调用七个 exec
函数之一,然后你可以说代码段是共享的,因为 COW - 因为代码段在执行过程中从不写入,并且映射为只读,那么它必须自动共享,对吧?
如果您从另一个 shell 启动同一个可执行文件怎么办? (或者其他一些不相关的进程 fork 并执行同一个程序?它不一定是一个 shell...)
如果代码段共享是 COW 的结果,在这种情况下我们不会从共享代码段中获益,因为进程是不相关的(所以没有与其他实例开始的 COW 共享页面)。
相反,代码段与内存映射文件共享。在内存中加载新的可执行文件时,调用 mmap(2)
将二进制文件的内容映射到内存中。
and if it is not, what is the process which ensures that no unnecessary copies of the program's code reside in the memory?
具体的实现细节取决于操作系统,但并不复杂。从概念上讲,mmap(2)
将文件映射到内存中,因此您只需要在底层文件表示上保留一些状态,以跟踪该文件的哪些(如果有)内存映射处于事件状态。这些信息通常保存在文件的 inode 中。 .
例如,Linux 将文件与内存地址空间与 struct inode
的 i_mapping
字段相关联。因此,当第一次对二进制文件调用 mmap(2)
时,会分配物理内存页来保存信息,并设置该文件 inode 的 i_mapping
字段;稍后的调用将使用 i_mapping
字段并意识到有一个地址空间与此 inode 相关联,并且因为它是只读的,所以没有分配物理页面,因此所有内容最终都是共享的。请注意,每个进程的虚拟内存可能不同,尽管它引用相同的物理页面(这意味着内核至少会分配和更新每个进程的页表,但仅此而已)。
The inode
structure is defined in fs.h
- 我只能猜测其他 UNIX 变体以类似的方式执行此操作。
当然,只要使用相同的二进制文件,这一切都有效。如果您复制二进制文件并分别执行两个副本,出于显而易见的原因,代码段将不会共享。
关于linux - Linux 中进程间如何共享代码段?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32170711/
我是 Linux 的新手,并且继承了保持我们的单一 Linux 服务器运行的职责。这是我们的SVN服务器,所以比较重要。 原来在我之前维护它的人有一个 cron 任务,当有太多 svnserve 进程
Node 虽然自身存在多个线程,但是运行在 v8 上的 JavaScript 是单线程的。Node 的 child_process 模块用于创建子进程,我们可以通过子进程充分利用 CPU。范例:
Jenkins 有这么多进程处于事件状态是否正常? 我检查了我的设置,我只配置了 2 个“执行者”... htop http://d.pr/i/RZzG+ 最佳答案 您不仅要限制 Master 中的执
我正在尝试在 scala 中运行这样的 bash 命令: cat "example file.txt" | grep abc Scala 有一个特殊的流程管道语法,所以这是我的第一个方法: val f
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
我需要一些帮助来理解并发编程的基础知识。事实上,我读得越多,就越感到困惑。因此,我理解进程是顺序执行的程序的一个实例,并且它可以由一个或多个线程组成。在单核CPU中,一次只能执行一个线程,而在多核CP
我的问题是在上一次集成测试后服务器进程没有关闭。 在integration.rs中,我有: lazy_static! { static ref SERVER: Arc> = {
我正在使用 Scala scala.sys.process图书馆。 我知道我可以用 ! 捕获退出代码和输出 !!但是如果我想同时捕获两者呢? 我看过这个答案 https://stackoverflow
我正在开发一个C++类(MyClass.cpp),将其编译为动态共享库(MyClass.so)。 同一台Linux计算机上运行的两个不同应用程序将使用此共享库。 它们是两个不同的应用程序。它不是多线程
我在我的 C 程序中使用 recvfrom() 从多个客户端接收 UDP 数据包,这些客户端可以使用自定义用户名登录。一旦他们登录,我希望他们的用户名与唯一的客户端进程配对,这样服务器就可以通过数据包
如何更改程序,以便函数 function_delayed_1 和 function_delayed_2 仅同时执行一次: int main(int argc, char *argv[]) {
考虑这两个程序: //in #define MAX 50 int main(int argc, char* argv[]) { int *count; int fd=shm
请告诉我如何一次打开三个终端,这样我的项目就可以轻松执行,而不必打开三个终端三次然后运行三个exe文件。请问我们如何通过脚本来做到这一点,即打开三个终端并执行三个 exe 文件。 最佳答案 在后台运行
我编写了一个监控服务来跟踪一组进程,并在服务行为异常、内存使用率高、超出 CPU 运行时间等时发出通知。 这在我的本地计算机上运行良好,但我需要它指向远程机器并获取这些机器上的进程信息。 我的方法,在
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 想改进这个问题?将问题更新为 on-topic对于堆栈溢出。 8年前关闭。 Improve this qu
我有一个允许用户上传文件的应用程序。上传完成后,必须在服务器上完成许多处理步骤(解压、存储、验证等...),因此稍后会在一切完成后通过电子邮件通知用户。 我见过很多示例,其中 System.Compo
这个问题对很多人来说可能听起来很愚蠢,但我想对这个话题有一个清晰的理解。例如:当我们在 linux(ubuntu, x86) 上构建一个 C 程序时,它会在成功编译和链接过程后生成 a.out。 a.
ps -eaf | grep java 命令在这里不是识别进程是否是 java 进程的解决方案,因为执行此命令后我的许多 java 进程未在输出中列出。 最佳答案 简答(希望有人写一个更全面的): 获
我有几个与内核态和用户态的 Windows 进程相关的问题。 如果我有一个 hello world 应用程序和一个暴露新系统调用 foo() 的 hello world 驱动程序,我很好奇在内核模式下
我找不到很多关于 Windows 中不受信任的完整性级别的信息,对此有一些疑问: 是否有不受信任的完整性级别进程可以创建命名对象的地方? (互斥锁、事件等) 不受信任的完整性级别进程是否应该能够打开一
我是一名优秀的程序员,十分优秀!