c++ - 使用 Boost 的 file_mapping 和 mapped_region 最小化内存使用？-6ren

c++ - 使用 Boost 的 file_mapping 和 mapped_region 最小化内存使用？

转载作者：塔克拉玛干更新时间：2023-11-03 07:28:58

24

4

对于这个问题，我将一个大的三维体从文件加载到一个程序中，但通常一次只需要查看三个平面 (x,y,z)。我目前正在使用 Boost::Interprocess::File_Mapping 创建文件 (32 GB) 的映射并将其加载到我有 24 GB RAM 的系统上。当前方法对文件使用单个 Boost::Interprocess::Mapped_Region。内存使用率很快接近 99%。

我是内存映射文件 i/o 领域的新手，想知道如何最好地对文件进行分段以减少内存使用量。创建缩小区域(例如每个 Z 平面)会改善结果吗？我想在不造成不利影响的情况下使用尽可能少的内存。

我这样做的方式是否正确，或者是否有更直接的方法来执行此操作？

最佳答案

在 Windows 上，它通常工作正常。我创建了一个测试应用程序(抱歉，我讨厌 boost，因为我认为它的质量很糟糕，我的示例使用 ATL，但底层 Windows API 是相同的):

HRESULT TestMain( LPCTSTR strFileName )
{
    CAtlFile file;
    HRESULT hr = file.Create( strFileName, GENERIC_READ, FILE_SHARE_READ, OPEN_EXISTING );
    if( FAILED( hr ) )
        return hr;
    CAtlFileMapping<BYTE> mapping;
    hr = mapping.MapFile( file );
    if( FAILED( hr ) )
        return hr;
    size_t sz = mapping.GetMappingSize();
    BYTE res = 0;
    for( size_t i = 0; i < sz; i++ )
        res ^= mapping[ i ];

    printf( "Read the complete file, %Iu bytes, the XOR is %.2X\n", sz, int( res ) );
    return S_OK;
}

当被要求在我的 8GB RAM 机器上读取 12GB 文件时，我看到了你描述的效果(我进程的资源监视器内存数据:提交 25 MB，私有(private) 20 MB，工作集和可共享 6.5 GB我的可用 RAM 的数量)。然而，互联网上的多个消息来源说这些数字没有任何意义并且不会影响性能，因为只要任何进程请求更多内存，未使用的物理页面就会被丢弃，而且这个过程非常便宜(当然除非你正在写你的内存映射文件)。

或者，如果您真的对此行为不满意，您可以通过调用 VirtualUnlock 自行释放未使用的部分，如下所述:https://stackoverflow.com/a/1882478/126995

或者，您可以只映射您需要的文件部分。

但您能做的最好的事情就是优化您的数据布局。如果在您的数据文件中您将体素保存为 double voxels[x][y][z]，请将它们存储为 struct { double voxels[8][8][8] } block [x/8][y/8][z/8] 代替。这样， block 大小正好是 4kb，这是一个页面大小，如果您只需要访问，例如XZ 平面，您将节省很多的 I/O 带宽，数量级。只是不要搞砸了错位，即如果您在数据之前有一个标题，请确保标题的大小为 4kb*n，其中 n 是整数。

关于c++ - 使用 Boost 的 file_mapping 和 mapped_region 最小化内存使用？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14903474/

24

4

0

文章推荐： c++ - ncurses:移动/调整窗口大小后 wgetch 无法正确读取

文章推荐： c++ - 将成员函数分配给其他函数

文章推荐： C++ iostream 以多个字节的定界符读取

c++ - 如何像二进制文件一样读取 boost mapped_region 对象？
我在这个 Tutorial 之后将一个二进制文件映射到内存中使用 boost 库，但现在我不知道如何使用直接打开它时使用 ifstream 的相同方式迭代二进制对象: 这是代码 #include #
c++ - 在 boost::mapped_region 上刷新是多余的吗？
我正在试验 boost::interprocess::mapped_regions 以快速读取/写入数据。我的理解是，一旦映射区域指向一个内存映射对象(在我的例子中是一个 boost::interp
c++ - 使用 boost::mapped_region 生成文件以进一步写入？
我需要创建并写入一个内存映射文件。有时需要增大文件。我创建了以下小测试，我创建了一个文件，使用 boost::mapped_region 映射它并写入它。这一切都按预期工作: #include
c++ - 直接访问 boost::mapped_region 数据？
在下面的代码中: file_mapping fm(FilePath, read_only); mapped_region region(fm,read_only); char* const data
c++ - 遍历 boost mapped_region/memory-mapped 文件？
我有以下代码将文件加载到 boost mapped_region 中: file_mapping fm(FilePath, read_only); mapped_region region(fm, r
c++ - 使用 Boost 的 file_mapping 和 mapped_region 最小化内存使用？
对于这个问题，我将一个大的三维体从文件加载到一个程序中，但通常一次只需要查看三个平面 (x,y,z)。我目前正在使用 Boost::Interprocess::File_Mapping 创建文件 (3

首页

博学

6Ren·AI

商城

c++ - 使用 Boost 的 file_mapping 和 mapped_region 最小化内存使用？