gpt4 book ai didi

c - 主存中的操作系统内核和进程

转载 作者:IT王子 更新时间:2023-10-28 23:53:00 26 4
gpt4 key购买 nike

继续我在操作系统开发研究方面的努力,我已经在脑海中构建了一幅几乎完整的图景。一件事仍然让我难以理解。

根据我的理解,这是基本的启动过程:

1) BIOS/Bootloader 执行必要的检查,初始化所有内容。

2) 内核加载到RAM中。

3) 内核执行初始化并开始调度任务。

4) 当一个任务被加载时,它被赋予一个它所在的虚拟地址空间。包括.text、.data、.bss、heap和stack。此任务“维护”它自己的堆栈指针,指向它自己的“虚拟”堆栈。

5) 上下文切换只是将寄存器文件(所有 CPU 寄存器)、堆栈指针和程序计数器压入某个内核数据结构并加载属于另一个进程的另一个集合。

在这个抽象中,内核是一个“母”进程,所有其他进程都在其中托管。我试图在下图中表达我的最佳理解:

enter image description here

问题是,首先这个简单模型是否正确?

其次,可执行程序如何知道它的虚拟堆栈?计算虚拟堆栈指针并将其放入相关的 CPU 寄存器中是 OS 的工作吗?其余的堆栈簿记是由 CPU 弹出和推送命令完成的吗?

内核本身有自己的主栈和堆吗?

谢谢。

最佳答案

Question is, first is this simple model correct?

您的模型非常简化但基本上是正确的 - 请注意,您模型的最后两部分并未真正被视为引导过程的一部分,内核也不是一个过程。将其可视化为一个过程可能很有用,但它不符合过程的定义,而且它的行为也不像一个过程。

Second, how is the executable program made aware of its virtual stack? Is it the OS job to calculate the virtual stack pointer and place it in the relevant CPU register? Is the rest of the stack bookkeeping done by CPU pop and push commands?

可执行的 C 程序不必“知道它的虚拟堆栈”。当 C 程序被编译成可执行文件时,局部变量通常是相对于堆栈指针引用的 - 例如,[ebp - 4]

当 Linux 加载一个新程序执行时,它使用 start_thread宏(从 load_elf_binary 调用)来初始化 CPU 的寄存器。该宏包含以下行:

regs->esp = new_esp;   

这会将 CPU 的堆栈指针寄存器初始化为操作系统分配给线程堆栈的虚拟地址。

如您所说,一旦加载了堆栈指针,poppush 等汇编命令就会更改其值。操作系统负责确保有对应于虚拟堆栈地址的物理页面——在使用大量堆栈内存的程序中,物理页面的数量将随着程序的继续执行而增长。您可以使用 ulimit -a 命令找到每个进程的限制(在我的机器上,最大堆栈大小为 8MB,或 2KB 页)。

Does the kernel itself have its own main stack and heap?

这就是将内核可视化为一个进程会变得困惑的地方。首先,Linux中的线程有用户栈和内核栈。它们本质上是相同的,仅在保护和位置上有所不同(在内核模式下执行时使用内核堆栈,在用户模式下执行时使用用户堆栈)。

内核本身没有自己的栈。内核代码总是在某个线程的上下文中执行,每个线程都有自己的固定大小(通常为 8KB)的内核堆栈。当线程从用户模式移动到内核模式时,CPU 的堆栈指针会相应更新。因此,当内核代码使用局部变量时,它们存储在它们正在执行的线程的内核堆栈中。

在系统启动期间,start_kernel函数初始化内核 init 线程,然后它将创建其他内核线程并开始初始化用户程序。所以系统启动后CPU的栈指针会被初始化指向init的内核栈。

就堆而言,您可以使用 kmalloc 在内核中动态分配内存,它将尝试在内存中找到空闲页面 - 其内部实现使用 get_zeroed_page .

关于c - 主存中的操作系统内核和进程,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28918019/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com