- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
所以,我使用了 fork()
并且知道它的作用。作为一个初学者,我很害怕它(我仍然不完全理解它)。 fork()
的一般描述你可以在网上找到,它复制当前进程并分配不同的 PID,父 PID 和进程将有不同的地址空间。一切都很好,但是,鉴于此功能描述,初学者会想知道“为什么这个功能如此重要......为什么我要复制我的流程?”。所以我确实想知道,最终我发现这就是您可以通过 execve()
系列从当前进程中调用其他进程的方式。
我仍然不明白为什么你必须这样做?最合乎逻辑的事情是拥有一个可以像
一样调用的函数create_process("executable_path+name",params..., more params);
这将产生一个新进程并在 main() 的开头开始运行它并返回新的 PID。
让我感到困扰的是 fork/execve 解决方案正在做可能不需要的工作。如果我的进程正在使用大量内存怎么办?内核是否复制我的页表等。我确信它并没有真正分配真正的内存,除非我接触过它。另外,如果我有线程会发生什么?在我看来,它太乱了。
几乎所有关于 fork 做什么的描述,说它只是复制进程,新进程在 fork()
调用之后开始运行。这确实是发生的事情,但为什么会这样,为什么 fork/execve 是生成新进程的唯一方法,以及从当前进程创建新进程的最通用的 unix 方法是什么?还有其他更有效的方法来生成进程吗?** 不需要复制更多内存。
This线程讨论了同样的问题,但我发现它不太令人满意:
谢谢。
最佳答案
这是由于历史原因。如 https://www.bell-labs.com/usr/dmr/www/hist.html 中所述,很早的Unix确实没有fork()
也没有exec*()
,shell执行命令的方式是:
exit()
,然后通过重新加载 shell(覆盖命令的内存)并跳转到它,返回到第 1 步来工作。从那里,fork()
是一个简单的添加(27 条装配线),可重复使用其余代码。
在 Unix 开发的那个阶段,执行命令变成了:
fork()
一个子进程,并等待它(通过向它发送消息)。exit()
,这现在更简单了。它只是清理了它的进程入口,并放弃了控制。最初,fork()
没有在写入时进行复制。由于这使得 fork()
变得昂贵,并且 fork()
经常被用来生成新进程(所以经常紧随其后的是 exec*()
),出现了fork()
的优化版本:vfork()
,父子共享内存。在那些 vfork()
的实现中,父级将被挂起,直到子级 exec*()
'ed 或 _exit()
'ed,因此放弃 parent 的内存。后来,fork()
被优化为在写入时进行复制,仅在内存页开始在父子节点之间出现差异时复制内存页。 vfork()
后来发现对 !MMU 系统的端口重新产生了兴趣(例如:如果你有一个 ADSL 路由器,它可能在 !MMU MIPS CPU 上运行 Linux),它无法进行 COW 优化,而且无法有效地支持 fork()
的进程。
fork()
中效率低下的其他原因是它最初复制了父级的地址空间(和页表),这可能会使从大型程序运行短程序相对较慢,或者可能使操作系统拒绝 fork()
认为可能没有足够的内存(要解决这个问题,您可以增加交换空间,或更改操作系统的内存过度使用设置)。作为轶事,Java 7 使用 vfork()/posix_spawn()
来避免这些问题。
另一方面,fork()
使得创建同一进程的多个实例非常高效:例如:一个 Web 服务器可能有多个相同的进程为不同的客户端服务。其他平台偏爱线程,因为生成不同进程的成本远高于复制当前进程的成本,而复制当前进程的成本可能仅比生成新线程的成本高一点。这是不幸的,因为共享所有线程是错误的磁铁。
关于linux - 为什么 fork() 以它的方式工作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8292217/
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,
Linux 管道可以缓冲多少数据?这是可配置的吗? 如果管道的两端在同一个进程中,但线程不同,这会有什么不同吗? 请注意:这个“同一个进程,两个线程”的问题是理论上的边栏,真正的问题是关于缓冲的。 最
我找到了here [最后一页] 一种有趣的通过 Linux 启动 Linux 的方法。不幸的是,它只是被提及,我在网上找不到任何有用的链接。那么有人听说过一种避免引导加载程序而使用 Linux 的方法
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
我试图了解 ld-linux.so 如何在 Linux 上解析对版本化符号的引用。我有以下文件: 测试.c: void f(); int main() { f(); } a.c 和 b.c:
与 RetroPie 的工作原理类似,我可以使用 Linux 应用程序作为我的桌面环境吗?我实际上并不需要像实际桌面和安装应用程序这样的东西。我只需要一种干净简单的方法来在 RaspberryPi 上
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎不是关于 a specific programming problem, a softwar
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 10 年前。 Improve thi
有什么方法可以覆盖现有的源代码,我应该用 PyQt、PyGTK、Java 等从头开始构建吗? 最佳答案 如果您指的是软件本身而不是它所连接的存储库,那么自定义应用程序的方法就是 fork 项目。据我所
我的情况是:我在一个磁盘上安装了两个 linux。我将第一个安装在/dev/sda1 中,然后在/dev/sda2 中安装第二个然后我运行第一个系统,我写了一个脚本来在第一个系统运行时更新它。
我在 i2c-0 总线上使用地址为 0x3f 的系统监视器设备。该设备在设备树中配置有 pmbus 驱动程序。 问题是,加载 linux 内核时,这个“Sysmon”设备没有供电。因此,当我在总线 0
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 11 年前。 Improve thi
我正试图在 linux 模块中分配一大块内存,而 kalloc 做不到。 我知道唯一的方法是使用 alloc_bootmem(unsigned long size) 但我只能从 linux 内核而不是
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎不是关于 a specific programming problem, a softwar
我有 .sh 文件来运行应用程序。在该文件中,我想动态设置服务器名称,而不是每次都配置。 我尝试了以下方法,它在 CentOS 中运行良好。 nohup /voip/java/jdk1.8.0_71/
我是在 Linux 上开发嵌入式 C++ 程序的新手。我有我的 Debian 操作系统,我在其中开发和编译了我的 C++ 项目(一个简单的控制台进程)。 我想将我的应用程序放到另一个 Debian 操
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 4 年前。 Improve this ques
我使用4.19.78版本的稳定内核,我想找到带有企鹅二进制数据的C数组。系统启动时显示。我需要在哪里搜索该内容? 我在 include/linux/linux_logo.h 文件中只找到了一些 Log
我知道可以使用 gdb 的服务器模式远程调试代码,我知道可以调试针对另一种架构交叉编译的代码,但是是否可以更进一步,从远程调试 Linux 应用程序OS X 使用 gdbserver? 最佳答案 当然
是否有任何可能的方法来运行在另一个 Linux 上编译的二进制文件?我知道当然最简单的是在另一台机器上重建它,但假设我们唯一能得到的是一个二进制文件,那么这可能与否? (我知道这可能并不容易,但我只是
我是一名优秀的程序员,十分优秀!