- r - 以节省内存的方式增长 data.frame
- ruby-on-rails - ruby/ruby on rails 内存泄漏检测
- android - 无法解析导入android.support.v7.app
- UNIX 域套接字与共享内存(映射文件)
假设地址空间可以覆盖文件,在我看来,mmap 只是分配了一块与将要读取的文件一样大的内存,并在它们对应的块之间创建了 1 对 1 的关系。但是,为什么这样做会加快文件读取速度?看来,要想真正得到文件的内容,还是得去磁盘,读取磁盘上的所有字节。
与malloc'ing相同大小的内存并手动将整个文件读入malloc'ed区域相比,它有什么区别?
最佳答案
mmap
工作方式不同。它是预期的并适应程序的访问模式。此外,可以通过 madvise
设置特定策略。进一步微调使用。
有关如何更彻底的讨论 mmap
在需求分页环境中工作,请在此处查看我的答案:Which segments are affected by a copy-on-write?因为它还谈到了 mmap
的使用mmap
是程序执行的命脉,通过 execve
等。阿尔。所以,你可以打赌它很快。作为旁注,具有讽刺意味的是 malloc
实际使用匿名mmap
以及。
但是,对于这里的讨论,特别要注意带有 mmap
的文件的“后备存储”(即分页磁盘)。对比做 malloc
和 read(2)
与 mmap
,内存区域的后备存储是文件本身。该区域将页面直接映射到内核的文件系统缓冲区页面 [它们已经统一了很长时间]。因此,不需要像 read(2)
那样从内核文件系统缓冲区页面到应用程序页面的 [浪费] 复制。 .
当您这样做时malloc/read
,您仍然拥有上述页面,但是,现在 malloc 区域在分页/交换磁盘上有一个后备存储。因此,页面缓冲区是 mmap
的两倍.正如我所提到的,读取完成后必须将数据复制到该区域中。
此外,就性能而言,进行大量读取并不是最佳选择。块中的推荐大小约为 64 KB [取决于文件系统]。
当您进行大量读取时,您的程序在完成之前无法启动。如果文件的大小大于物理内存,系统会读入你的 malloc 区域,并且会浪费性地开始将较早的页面刷新到分页磁盘,为靠近文件末尾的页面腾出空间,直到整个文件被读入。
换句话说,当这个大的预读发生时,应用程序正在等待[并且什么也不做]。对于 [比如说] 60 GB 的文件,启动时间会很明显。
如果您的文件确实足够大,您甚至会耗尽分页磁盘上的空间(即 malloc
返回 NULL)。
对于 mmap
,不存在这样的问题。当您映射文件时,您可以立即开始使用它。它将直接从该区域的后备存储(再次是文件系统中的文件)根据需要“故障”。而且,如果您有 [说] 1 TB 文件,mmap
处理得很好。
此外,您可以通过 madvise(2)
控制映射策略。和 posix_madvise(2)
逐页或任何页面范围,包括整个文件。 madvise
syscall 相对轻量级,因此可以大量使用它。这是一个提示,但不会执行会延迟应用程序的 I/O。如果 I/O 开始预读提示,它由内核作为后台事件完成。
你甚至可以告诉系统很快就会需要给定的页面[并且系统以此作为预取它的提示]或者你可以告诉系统不再需要该页面[并且系统将释放页面缓冲内存]。
您可以对整个文件说“顺序访问”,这意味着系统将知道自动进行预读,以及释放不再需要的页面(即,如果您当前正在访问页面 N,然后系统释放Nk之前的任何页面)
当你做 read(2)
,无法告诉系统不再需要给定的内核 FS 页缓冲区。它们会徘徊,直到物理 RAM 填满 [或超过给定的限制],这会给整个内存系统增加压力。
在实践中,使用 read
,我已经看到在应用程序移动到文件的不同部分或完全不同的文件后很长一段时间内,用于 FS 缓冲区的内存量仍然很高。事实上,我已经看到一个 I/O 密集型应用程序使用了如此多的缓冲区,以至于导致无关的 [空闲] 进程的页面被盗并刷新到分页磁盘。当我停止 I/O 应用程序时,firefox 需要几分钟的时间才能重新调入页面并再次响应。
我为常规读取与 mmap 做了一些广泛的基准测试。从中,mmap 可以提高某些应用程序的速度。
在此处查看我的回答:read line by line in the most efficient way *platform specific*
在我这样做之前,我对 mmap 的好处持怀疑态度,但基准测试表明 mmap 是赢家。
另外,如果你正在做 read(2)
(速度)对比 fgets
,如果给定的行跨越读取缓冲区边界(即缓冲区的最后 50 个字符具有 80 个字符行的前 50 个字节),您可能会因必须执行的缓冲区移位而陷入困境。
请注意,在此链接页面中的评论中,还有另一个指向 pastebin 的链接指向我的基准程序的更高版本,并且结果太大而无法发布在上述 SO 答案中,该答案对各种进行了基准测试和比较 madvise
选项
关于linux - mmap 如何提高文件读取速度?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37172740/
我正在比较工作簿中的工作表。该工作簿有两张名为 PRE 和 POST 的工作表,每张工作表都有相同的 19 列。行数每天都不同,但特定一天的两张表的行数相同。该宏将 PRE 工作表中的每一行与 POS
我有一个对象数组,我一次循环遍历该数组一个对象,然后进行几次检查以查看该数组中的每个对象是否满足特定条件,如果该对象满足此条件,则复制一个属性将此对象放入数组中(该属性还包含另一个对象)。 for(v
我正在编写一个必须非常快的应用程序。我使用 Qt 5.5 和 Qt Creator,Qt 的 64 位 MSVC2013 编译版本。 我使用非常困倦的 CS 来分析我的应用程序,我看到占用最多独占时间
我有以下 CountDownTimer 在我的 Android 应用程序中不断运行。 CountDownTimer timer_status; timer_status = new CountDown
有一个优化问题,我必须调用随机森林回归器的预测函数数千次。 from sklearn.ensemble import RandomForestRegressor rfr = RandomForestR
我正在努力提高现有 Asp.Net Web 应用程序的数据访问层的性能。场景是。 它是一个基于 Web 的 Asp.Net 应用程序。 数据访问层使用 NHibernate 1.2 构建并作为 WCF
我在我的 Intel Edison 上运行 Debian,并尝试使用 ffmpeg 通过 USB 网络摄像头捕获视频。我正在使用的命令是: ffmpeg -f video4linux2 -i /dev
我有一个 For循环遍历整数 1 到 9 并简单地找到与该整数对应的最底部的条目(即 1,1,1,2,3,4,5 将找到第三个“1”条目)并插入一个空白行。我将数字与仅对应于此代码的应用程序的字符串“
我有一个带有非规范化架构(1 个表)的 postgresql 数据库,其中包含大约 400 万个条目。现在我有这个查询: SELECT count(*) AS Total, (SELECT c
在 Ltac 中实现复杂的策略时,有一些 Ltac 命令或策略调用我预计会失败以及预期失败(例如终止 repeat 或导致回溯)。这些故障通常在故障级别 0 时引发。 更高级别引发的故障“逃避”周
我正在尝试提高 ansible playbook 的性能。我有一个测试剧本如下: --- - name: Test hosts: localhost connection: local g
我正在使用 axios从 Azure 存储 Blob 下载文件 (~100MB)。 axios({ method: 'get', url: uri, onDownloadProgress:
我有一个 ClojureScript 程序,主要对集合执行数学计算。它是在惯用的、独立于主机的 Clojure 中开发的,因此很容易对其进行基准测试。令我惊讶的是(与答案对 Which is fast
我有一个程序必须在硬件允许的情况下尽快发出数千个 http 请求。在现实世界中,这些连接中的每一个都将连接到一个离散的服务器,但我已经编写了一个测试程序来帮助我模拟负载(希望如此)。 我的程序使用 A
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
我正在计算 Clojure 中 3d 点云的边界框。点云表示为 Java 原始浮点数组,点云中的每个点都使用 4 个浮点存储,其中最后一个浮点未使用。像这样: [x0 y0 z0 u0 x1 y1
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
我正在尝试使用rayshader 包制作图像。我很高兴能够使用如下代码创建一个 png 文件: library(ggplot2) library(rayshader) example_plot <-
更新 显然,jQuery 模板可以被编译,并且它有助于显示带有 if 语句 的模板的性能 here . 但是如图here ,预编译的 jQuery 模板对我的情况没有多大作用,因为我的模板不包含逻辑
我是编程新手。我有一个启用分页的 ScrollView ,其中包含许多页面(最多十个),并且在每个页面上都有一个自定义按钮。每个自定义按钮都有一个自定义图像。我在 Interface Builder
我是一名优秀的程序员,十分优秀!