gpt4 book ai didi

delphi - 4000 万次页面错误。如何解决这个问题?

转载 作者:行者123 更新时间:2023-12-03 15:29:47 27 4
gpt4 key购买 nike

我有一个应用程序,它从磁盘加载 170 个文件(假设它们是文本文件)到各个对象中,并始终保存在内存中。当我从磁盘加载这些文件时,内存会被分配一次。因此,不涉及内存碎片。我还使用 FastMM 来确保我的应用程序永远不会泄漏内存。

应用程序会将所有这些文件相互比较以查找相似之处。过于简单化,我们可以说我们比较文本字符串,但算法要复杂得多,因为我必须允许字符串之间存在一些差异。每个文件大约300KB。加载到内存(保存它的对象)中大约需要 0.4MB 的 RAM。因此,正在运行的应用程序大约需要 60MB 或 RAM(工作集)。它处理数据大约 15 分钟。问题是它会产生超过 4000 万个页面错误。

为什么?我有大约 2GB 的可用 RAM。据我所知,页面错误很慢。他们使我的程序减慢了多少?如何优化程序以减少这些页面错误?我想这与数据局部性有关。有人知道这方面的一些示例算法吗(Delphi)?

更新:
但是看看页面错误的数量(任务管理器中没有其他应用程序可以与我的应用程序相媲美,甚至远远没有),我想如果我设法优化内存布局(减少页面错误),我可以提高应用程序的速度。

<小时/>

Delphi 7,Win 7 32 位,RAM 4GB(3GB 可见,2GB 可用)。

最佳答案

警告 - 我只是解决页面错误问题。

我不能确定,但​​您是否考虑过使用内存映射文件?这样,Windows 将使用文件本身作为分页文件(而不是主分页文件 pagrefile.sys)。如果文件是只读的,那么理论上页面错误的数量应该会减少,因为页面不需要通过分页文件写入磁盘,因为 Windows 将根据需要从文件本身加载数据。

现在,为了减少文件调入和调出,您需要尝试朝一个方向遍历数据,以便在读取新数据时,可以永远丢弃旧页面。在这里,您需要权衡再次检查文件和缓存数据 - 缓存必须存储在某个地方。

请注意,内存映射文件是 Windows 加载 .dll 和 .exe 等文件的方式。我用它们扫描了千兆字节的文件,而没有达到内存限制(当时我们有 MB,而不是 GB 的内存)。

但是,根据您描述的数据,我建议不返回所有文件的能力将减少重新分页的数量。

关于delphi - 4000 万次页面错误。如何解决这个问题?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3941735/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com