linux - mmap 与 malloc : strange performance-6ren

linux - mmap 与 malloc : strange performance

转载作者：IT王子更新时间：2023-10-29 00:59:45

25

4

我正在编写一些解析日志文件的代码，需要注意的是这些文件是压缩的，必须即时解压缩。这段代码对性能有些敏感，所以我正在尝试各种方法来找到正确的代码。无论我使用多少个线程，我基本上都拥有程序所需的 RAM。

我发现了一种似乎表现相当不错的方法，并且我正在尝试了解它提供更好性能的原因。

这两种方法都有一个读取器线程，一个从管道 gzip 进程读取并写入一个大缓冲区。然后在请求下一个日志行时延迟解析此缓冲区，返回本质上是指向缓冲区中不同字段所在位置的指针结构。

代码在 D 中，但它与 C 或 C++ 非常相似。

共享变量:

shared(bool) _stream_empty = false;;
shared(ulong) upper_bound = 0;
shared(ulong) curr_index = 0;

解析代码:

//Lazily parse the buffer
void construct_next_elem() {

    while(1) {
        // Spin to stop us from getting ahead of the reader thread
        buffer_empty = curr_index >= upper_bound -1 &&
                       _stream_empty;
        if(curr_index >= upper_bound && !_stream_empty) {
            continue;
        }
        // Parsing logic .....
    }
}

方法一:Malloc 一个足够大的缓冲区，可以在前面保存解压缩的文件。

char[] buffer;                   // Same as vector<char> in C++
buffer.length = buffer_length;   // Same as vector reserve in C++ or malloc

方法二:使用匿名内存映射作为缓冲区

MmFile buffer;
buffer = new MmFile(null,
                    MmFile.Mode.readWrite, // PROT_READ || PROT_WRITE
                    buffer_length,
                    null);                 // MAP_ANON || MAP_PRIVATE

读者线程:

ulong buffer_length = get_gzip_length(file_path);
pipe = pipeProcess(["gunzip", "-c", file_path],
                                   Redirect.stdout);
stream = pipe.stdout();

static void stream_data() {
    while(!l.stream.eof()) {

        // Splice is a reference inside the buffer
        char[] splice = buffer[upper_bound..upper_bound + READ_SIZE];
        ulong read = stream.rawRead(splice).length;
        upper_bound += read;
    }
    // Clean up
}

void start_stream() {
        auto t = task!stream_data();
        t.executeInNewThread();
        construct_next_elem();
}

我从方法 1 中获得了明显更好的性能，甚至在数量级上也是如此

User time (seconds): 112.22
System time (seconds): 38.56
Percent of CPU this job got: 151%
Elapsed (wall clock) time (h:mm:ss or m:ss): 1:39.40
Average shared text size (kbytes): 0
Average unshared data size (kbytes): 0
Average stack size (kbytes): 0
Average total size (kbytes): 0
Maximum resident set size (kbytes): 3784992
Average resident set size (kbytes): 0
Major (requiring I/O) page faults: 0
Minor (reclaiming a frame) page faults: 5463
Voluntary context switches: 90707
Involuntary context switches: 2838
Swaps: 0
File system inputs: 0
File system outputs: 0
Socket messages sent: 0
Socket messages received: 0
Signals delivered: 0
Page size (bytes): 4096
Exit status: 0

对比

User time (seconds): 275.92
System time (seconds): 73.92
Percent of CPU this job got: 117%
Elapsed (wall clock) time (h:mm:ss or m:ss): 4:58.73
Average shared text size (kbytes): 0
Average unshared data size (kbytes): 0
Average stack size (kbytes): 0
Average total size (kbytes): 0
Maximum resident set size (kbytes): 3777336
Average resident set size (kbytes): 0
Major (requiring I/O) page faults: 0
Minor (reclaiming a frame) page faults: 944779
Voluntary context switches: 89305
Involuntary context switches: 9836
Swaps: 0
File system inputs: 0
File system outputs: 0
Socket messages sent: 0
Socket messages received: 0
Signals delivered: 0
Page size (bytes): 4096
Exit status: 0

使用方法 2 获得更多页面错误。

谁能帮我解释一下为什么使用 mmap 时性能会出现如此明显的下降？

如果有人知道有更好的方法来解决这个问题，我会很乐意听到。

编辑-----

将方法 2 更改为:

       char * buffer = cast(char*)mmap(cast(void*)null,
                            buffer_length,
                            PROT_READ | PROT_WRITE,
                            MAP_ANON | MAP_PRIVATE,
                            -1,
                            0);

与使用简单的 MmFile 相比，现在性能提高了 3 倍。我试图弄清楚是什么导致了性能上如此明显的差异，它本质上只是 mmap 的包装器。

仅使用直接 char* mmap 与 Mmfile 的性能数字，页面错误更少:

User time (seconds): 109.99
System time (seconds): 36.11
Percent of CPU this job got: 151%
Elapsed (wall clock) time (h:mm:ss or m:ss): 1:36.20
Average shared text size (kbytes): 0
Average unshared data size (kbytes): 0
Average stack size (kbytes): 0
Average total size (kbytes): 0
Maximum resident set size (kbytes): 3777896
Average resident set size (kbytes): 0
Major (requiring I/O) page faults: 0
Minor (reclaiming a frame) page faults: 2771
Voluntary context switches: 90827
Involuntary context switches: 2999
Swaps: 0
File system inputs: 0
File system outputs: 0
Socket messages sent: 0
Socket messages received: 0
Signals delivered: 0
Page size (bytes): 4096
Exit status: 0

最佳答案

您会遇到页面错误和速度变慢，因为默认情况下 mmap 仅在您尝试访问页面时才加载它。

另一方面，阅读知道您正在按顺序阅读，因此它会在您请求之前提前获取页面。

看看 madvise调用——它的目的是向内核发出信号，告诉内核您打算如何访问 mmap 文件，并允许您为 mmap 内存的不同部分设置不同的策略——例如，您有一个要保留的索引 block 在内存 [MADV_WILLNEED] 中，但内容是随机和按需访问的 [MADV_RANDOM]，或者您在顺序扫描 [MADV_SEQUENTIAL] 中循环内存

然而，操作系统完全自由忽略您设置的策略，所以 YMMW

关于linux - mmap 与 malloc : strange performance，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27837147/

25

4

0

文章推荐： templates - golang 模板中的调用链

文章推荐： git - 可能通过 git 丢失了一些更改

文章推荐： php - 使用 PHP 更改符号链接(symbolic link)的目标

文章推荐： git - 为什么我的 GitHub 提交总是显示为未知作者？

java - Strange if 行为的解释
这个问题在这里已经有了答案: How do I compare strings in Java? (23 个回答) 关闭 9 年前。所以我运行了这段代码 String line =
jQuery on() : strange behaviour
此代码适用于我的网站: $(function(){ $('.link-follow-stop').on('click', function(event){ console.lo
java和线程: very strange behaviour
private synchronized Map calculateStanding() { System.out.println("Calculate standing for
Java内存不足错误: Strange behavior
下面的程序 (prog1) 抛出 OutOfMemoryError 错误。确实如此。但如果我在第 5 行(prog2)下方添加 sysout，它不会抛出错误。这种奇怪的行为有什么原因吗？程序1: p
Python "strange"输出
class Foo(object): def __init__(self,x): self.x = x self.is_bar = False def
CSS :after & :before acting very strangely
好的，我有一个设置了高度和宽度的简单 div。前后也设置了高度和宽度。它们都设置为显示为 block ，伪元素的内容为“”。 :before 在内容里面，而不是在它之前。:after 之前有一大堆奇怪
Scala 可变集 : strange behavior
我无法解释 Scala 集合的这种行为。让我们从一些定义开始。 import scala.collection.mutable.Set case class Item(name: String, c
C 结构初始化 : strange way
在阅读我遇到的代码时，结构的以下定义和初始化: // header file struct foo{ char* name; int value; }; //Implementation file s
c - 二进制数 : strange differences between + and |
我正在尝试用 c 操作二进制数。我用下面的最小代码发现了一个奇怪的事情。谁能告诉我“+”和“|”有什么区别这里？谢谢! char next_byte1 = 0b11111111; char next_
德尔福tstream : strange behaviour on create
我是德尔福的新手。在 TStrem 类的文档中，我读到它是一个抽象类。所以我认为当我尝试使用创建它时编译器会出错 stream := TStream.Create(); 为什么不呢？最佳答案 De
delphi - GetAsyncKeyState "strange"行为
我有 2 个简单的表单，Form1 和 Form2 (Delphi 7)。 Form1 打开 Form2，我在那里等待特定的组合键 (Ctrl + F2)。一旦我关闭 Form2 并返回到 Form1
c++ - “Strange”内存泄漏-TCP网络
我有很多建立TCP网络的类-使用boost::asio，使用Packet进行传输。 (Packet的基类是std::vector) 我以为我已经解决了所有可能的内存泄漏，但是后来我在关闭客户端之前只是
sql - 解码语句 : strange behaviour
我对以下声明有一些疑问: SELECT 1 FROM dual WHERE DECODE(1, 0, (SELECT COUNT(*) from tbl
symfony - 奏鸣曲管理包 : strange with labels
我已经在 symfony 2.1 上安装了最新的 Sonata 管理包，但遇到了以下问题: 配置文件: services: app.geo.admin.city: class: App
PHP - 图像输出 : strange string
我必须输出一系列先前保存在数据库中的随机图像。在输出的那一刻，而不是打印一张图片，代码打印一个奇怪的字符串(meaby dumpfile？): (¢Š(¢Š(¢Š(¢Š(¢Š(¢Š(¢Š(¢Š(¢Š(
c# - "Strange"C#语法
我刚刚在从 Code Project 下载的项目中看到了这个: base.DialogResult = this.Result != null; 我不认为自己是 C# 新手，但这个对我来说是新手。谁能
java - 类型转换和包装器 : some strange cases
看看这个...今天晚上我试图将一些 primiteves 转换到 wrapper 上时发现: Integer i = (Integer)4; Integer i = (Integer)4f; // D
python - 在函数内分配变量 : Strange behaviour
我很少使用 Python，所以我不清楚为什么允许这样的行为:没有 w 对象，因此它没有 s 属性，那为什么 f 允许进行 w.s 赋值？ >>> def f(): w.s="ads" #al
Jquery 克隆和单选按钮 : strange behavior
在 Jsfiddle 上:http://jsfiddle.net/jhzux/ 我在这个简单的脚本上浪费了很多时间。我想做的是在 jQuery 中启用克隆表单，然后使它们正常工作。首先，当我在 Js
javascript - 为什么会:after be drawed strangely?
这是我的代码: .specific_tag_cases a:after{ position: absolute; font-family: Arial; background-

首页

博学

6Ren·AI

商城

linux - mmap 与 malloc : strange performance