gpt4 book ai didi

c - 什么时候应该使用 mmap 进行文件访问?

转载 作者:塔克拉玛干 更新时间:2023-11-03 07:42:05 25 4
gpt4 key购买 nike

POSIX 环境至少提供两种访问文件的方式。有标准系统调用 open()read()write() 和 friend ,但也有使用 mmap() 将文件映射到虚拟内存。

什么时候使用一个比另一个更好?它们有哪些各自的优势值得包括两个接口(interface)?

最佳答案

mmap如果您有多个进程以只读方式从同一个文件访问数据,这在我编写的服务器系统中很常见,那就太好了。 mmap 允许所有这些进程共享相同的物理内存页,从而节省大量内存。

mmap 还允许操作系统优化分页操作。例如,考虑两个程序;程序 A1MB 文件读入使用 malloc 创建的缓冲区,程序 B mmaps 1MB文件存入内存。如果操作系统必须将 A 的部分内存换出,它必须先写入要交换的缓冲区的内容,然后才能重新使用内存。在 B 的情况下,任何未修改的 mmap 页面都可以立即重用,因为操作系统知道如何从它们是 mmap 的现有文件中恢复它们> 来自。 (操作系统可以通过最初将可写的 mmap 页面标记为只读并捕获 seg faults 来检测哪些页面未被修改,类似于 Copy on Write 策略)。

mmapinter process communication 也很有用.您可以在需要通信的进程中将文件mmap 读/写,然后在mmap 的 区域中使用同步原语(这就是MAP_HASSEMAPHORE 标志用于)。

如果您需要在 32 位机器上处理非常大的文件,mmap 可能会很尴尬。这是因为 mmap 必须在您进程的地址空间中找到一个连续的地址 block ,该地址空间足够大以适合被映射文件的整个范围。如果您的地址空间变得碎片化,这可能会成为一个问题,您可能有 2 GB 的可用地址空间,但没有任何一个范围可以容纳 1 GB 的文件映射。在这种情况下,您可能必须将文件映射到比您希望的更小的 block 中以使其适合。

mmap 替代读/写的另一个潜在的尴尬是您必须在页面大小的偏移量上开始映射。如果您只想在偏移量 X 处获取一些数据,则需要修复该偏移量,以便它与 mmap 兼容。

最后,读/写是您可以处理某些类型文件的唯一方式。 mmap 不能用于 pipes 之类的东西和 ttys .

关于c - 什么时候应该使用 mmap 进行文件访问?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47911865/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com