c++ - 一个单独的循环减慢了一个独立的早期循环？-6ren

c++ - 一个单独的循环减慢了一个独立的早期循环？

转载作者：可可西里更新时间：2023-11-01 18:37:34

25

4

一个单独的循环如何影响一个独立的早期循环的性能？

我的第一个循环读取一些大文本文件并计算行数。在 malloc 之后，第二个循环填充分配的矩阵。

如果第二个循环被注释掉，第一个循环需要 1.5 秒。然而，用第二个循环编译会减慢第一个循环，现在需要 30-40 秒!

换句话说:第二个循环以某种方式减慢了第一个循环。我曾尝试更改范围、更改编译器、更改编译器标志、更改循环本身、将所有内容放入 main()、使用 boost::iostream 甚至将一个循环放在共享库中，但每次尝试都存在相同的问题!

第一个循环很快，直到程序用第二个循环编译。

编辑:这是我的问题的完整示例------------>

#include <iostream>
#include <vector>
#include "string.h"
#include "boost/chrono.hpp"
#include "sys/mman.h"
#include "sys/stat.h"
#include "fcntl.h"
#include <algorithm>

unsigned long int countLines(char const *fname) {
    static const auto BUFFER_SIZE = 16*1024;
    int fd = open(fname, O_RDONLY);
    if(fd == -1) {
        std::cout << "Open Error" << std::endl;
        std::exit(EXIT_FAILURE);
    }

    posix_fadvise(fd, 0, 0, 1); 
    char buf[BUFFER_SIZE + 1];
    unsigned long int lines = 0;

    while(size_t bytes_read = read(fd, buf, BUFFER_SIZE)) {
        if(bytes_read == (size_t)-1) {
            std::cout << "Read Failed" << std::endl;
            std::exit(EXIT_FAILURE);
        }
        if (!bytes_read)
            break;

        int n;
        char *p;
        for(p = buf, n=bytes_read ; n > 0 && (p = (char*) memchr(p, '\n', n)) ; n = (buf+bytes_read) - ++p)
            ++lines;
    }
    close(fd);
    return lines;
}

int main(int argc, char *argv[])
{
    // initial variables
    int offset = 55;  
    unsigned long int rows = 0;
    unsigned long int cols = 0;
    std::vector<unsigned long int> dbRows = {0, 0, 0};
    std::vector<std::string> files = {"DATA/test/file1.csv",  // large files: 3Gb 
                                      "DATA/test/file2.csv",  // each line is 55 chars long 
                                      "DATA/test/file3.csv"};

    // find each file's number of rows 
    for (int x = 0; x < files.size(); x++) {   // <--- FIRST LOOP **
        dbRows[x] = countLines(files[x].c_str());
    }

    // define matrix row as being the largest row found 
    // define matrix col as being 55 chars long for each csv file
    std::vector<unsigned long int>::iterator maxCount;
    maxCount = std::max_element(dbRows.begin(), dbRows.end());
    rows = dbRows[std::distance(dbRows.begin(), maxCount)];   // typically rows = 72716067
    cols = dbRows.size() * offset;                            //           cols = 165 

    // malloc required space (11998151055)
    char *syncData = (char *)malloc(rows*cols*sizeof(char));

    // fill up allocated memory with a test letter
    char t[]= "x";
    for (unsigned long int x = 0; x < (rows*cols); x++) {   // <--- SECOND LOOP **
        syncData[x] = t[0];
    } 

    free(syncData);
    return 0; 
}

我还注意到，减少列数可以加快第一个循环的速度。

探查器将手指指向这条线:

while(size_t bytes_read = read(fd, buf, BUFFER_SIZE))

程序在此行空闲 30 秒或等待 230,000 次。在汇编中，等待计数发生在:

Block 5:
lea 0x8(%rsp), %rsi
mov %r12d, %edi
mov $0x4000, %edx
callq  0x402fc0     <------ stalls on callq
Block 6:
mov %rax, %rbx
test %rbx, %rbx
jz 0x404480 <Block 18>

我的猜测是从流中读取时出现 API 阻塞，但我不知道为什么？

最佳答案

我的理论:

分配和接触所有内存会将大文件从磁盘缓存中逐出，因此下一次运行必须从磁盘中读取它们。

如果你运行了几次没有 loop2 的版本来预热磁盘缓存，然后运行一个有 loop2 的版本，我预计它第一次会很快，但如果没有首先再次预热磁盘缓存。

内存消耗发生在文件被读取之后。这会导致页面缓存(也称为磁盘缓存)出现“内存压力”，从而导致它从缓存中逐出数据以为进程写入页面腾出空间。

您的计算机可能只有勉强可用的 RAM 来缓存您的工作集。关闭您的网络浏览器可能会释放足够的空间来有所作为!或者不是，因为您的 11998151055 是 11.1GiB，并且您正在编写它的每一页。 (甚至每个字节。您可以使用 memset 来实现更高的性能，尽管我假设您所展示的只是一个虚拟版本)

顺便说一句，另一个调查这个的工具是time ./a.out。它可以显示您的程序是否将所有 CPU 时间都花在了用户空间与内核(“系统”)时间上。

如果 user+sys 相加为实时，则您的进程受 CPU 限制。如果不是，它是 I/O 绑定(bind)，并且您的进程在磁盘 I/O 上阻塞(这是正常的，因为计算换行符应该很快)。

关于c++ - 一个单独的循环减慢了一个独立的早期循环？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40350515/

25

4

0

文章推荐： c++ - 友元函数的使用声明

文章推荐： c++ - unique_ptr : linked list entry deletion

java - 如何反转字符串中的每个单词(单独)？
Java 专家需要您的帮助。今天我在一次采访中被问到这个问题，但我无法解决。所以我需要一个解决方案来解决这个问题；反转字符串 Input : Hello, World! Output : oll
javascript - 将项目添加到数组中 - 单独
目标:单击按钮并将成分作为单独的项目添加到数组中。当前设置: 这给出:蓝莓芒果柠檬汁然后我希望能够通过单击按钮将成分作为单独的项目添加到数组中: var allI
javascript - 正则表达式匹配双引号内的单引号(单独)？
如何编写正则表达式来匹配它(参见箭头): "this is a ->'' this is a "test' there is another "test' 第二种情况 /\b'/ Regex Demo
javascript - 从数组中删除所有项目(单独)
我有一个数组，其中包含有限数量的项目。我想随机删除项目，直到所有项目都被使用过一次。示例 [1,2,3,4,5] 使用了随机数 5，所以我不想再这样了。使用了随机数 2，所以我不想再这样了。等等..
android - 单独/小组开发人员如何在多个设备上进行测试？
首先，抱歉，如果这太主观了，我只是不知道还能怎么问/去哪里问。无论如何，鉴于我最近的所有问题，我准备很快发布一个 Android 应用程序，并且大部分测试都是在我的手机 Droid 上完成的。我真的
delphi - 单独 .pas 文件中的字符串
这可能不是这个问题的正确位置，如果不合适请随意移动它。我标记为 Delphi/Pascal 因为这是我在 atm 中工作的内容，但这可能适用于我猜的所有编程。无论如何，我正在做一些代码清理，并考虑将
javascript - 单独(组织)快速路线
我像这样分隔了其余 api 的路由。有没有更好的方法来组织路由器？还是我现在的做法没问题？ app.js app.use('/api/auth',auth); 应用程序/ Controller /au
excel - 单独 Excel 工作表中特定数据的总和
我在 2 个单独的工作表中包含以下数据: 表1: A B C D a ff dd ff ee b 12 10 10 12 表2: A B C
jquery - 单独 HTML 文件中的可单击行可在新选项卡中打开不同的链接
我正在使用 jQuery，并在位于单独 HTML 文件中的表中获取了几行。单击时，每一行都会成功重定向到本地 HTML 文件。 (使用window.location) 我想要实现的目标我想要完成的是
html - 单独
的重叠背景图像会产生比它们本身更暗的阴影
我有重叠背景图像的问题，当它们重叠时会导致阴影比不重叠时更暗，从而产生不均匀的阴影。我有一个高度灵活的盒子，带有一些透明的背景图像和阴影以创建漂亮的边框。盒子本质上是 3 个元素。您可以在此处找到
c# - 单独 git 存储库中的服务结构项目
按照正常的微服务框架，我们希望将每个微服务放入其自己的 git 存储库中，然后为 Service Fabric 项目创建一个存储库。当我们更新其中一个微服务时，Service Fabric 项目将仅重
html - 单独 html 的多个包含
我想将多个片段嵌入到一个指令中。这是我的设置方式。 Everyone Development (3)
linux - 单独 Gzip 多个文件并保留原始文件
我希望在保留原件的同时将多个文件 gzip 到一个目录中(到多个 .gz 文件中)。我可以使用这些命令来处理单个文件: find . -type f -name "*cache.html" -exe
performance - 我如何知道 Eclipse 插件使用了多少内存(单独)
有没有办法分别知道每个 Eclipse 插件消耗了多少内存？最佳答案进行堆转储并使用例如分析它Eclipse Memory Analyser . 如需更多信息，请参阅 Analyzing Equi
gradle - Gradle-单独(其他)git存储库中DSL的通用部分
我们使用cusrom插件并以这种方式定义脚本(这是一个近似的伪代码): //It is common part for every script (1) environments { "env1"
单独 Dll 中的 Signalr Hub
我在控制台应用程序中托管了一个集线器，并有一个 WPF 应用程序连接到它。它工作得很好。然后我将集线器移到一个单独的项目中，并将主机的引用添加到新项目中。现在我收到 500 错误，没有其他详细信息。
单独 JAR 文件中的 JavaBeans 类
是否可以在单独的 JAR 文件中为 JavaBean 构建类？具体来说，JavaBean 在一个 JAR 文件中具有 Bean 和 BeanInfo 类，而自定义属性编辑器类位于另一个 JAR 文件中
C#、MAF、单独 AppDomain 中的未处理异常管理
好的，所以我有一个 MAF 应用程序，它在单独的应用程序域中加载每个插件。这非常适合我的需要，因为它允许我在运行时动态卸载和重新加载我的插件。问题是，我需要能够在子应用域中处理未处理的异常，捕获它，
mysql - SQL - 在另一个表上查找至少两个不同/单独/不同的值
在参加在线数据库类(class)(针对初学者)时，我注意到一个问题，我必须查找涉及...至少两个不同值的查询...例如， ELMASRI 书中的 COMPANY 数据库指出:查找至少从事两个不同项目的
css - 单独 div 中两行图像之间的空间，仅出现在一个特定行上
(首先:我已经尝试了涉及边距、边框等的所有选项。) Link to problematic page. Link to similarly constructed, non-problematic p

首页

博学

6Ren·AI

商城

c++ - 一个单独的循环减慢了一个独立的早期循环？

我还注意到，减少列数可以加快第一个循环的速度。