c++ - 写入内存缓冲区时的性能损失 (C++)-6ren

c++ - 写入内存缓冲区时的性能损失 (C++)

转载作者：行者123 更新时间：2023-11-28 00:19:26

24

4

我正在编写一个小型渲染器(基于光栅化算法)。这是我正在做的一个个人项目，用于测试不同的技术。我正在测量渲染一堆三角形所花费的时间，在这样做时我注意到了一些奇怪的事情。该程序所做的是，如果给定像素与 2D 三角形重叠并通过一些其他测试(它在缓冲区中写入该三角形的颜色)，则将其写入图像缓冲区(Vec3ui 的一维数组)。

Vec3<unsigned char> *fb = new Vec3<unsigned char>[w * h];
...
void rasterize(
    ...,
    Vec3<unsigned char> *&fb,
    float *&zbuffer)
{
    Vec3<unsigned char> randcol(drand48() * 255, drand48() * 255, drand48() * 255);
    ...
    uint32_t x, y;
    // loop over bounding box of triangle
    // check if given pixel is in triangle
    for (y = ymin, p.y = ymin; y <= ymax; ++y, ++p.y)
    {
        for (x = xmin, p.x = xmin; x <= xmax; ++x, ++p.x)
        {
            if (pixelOverTriangle(...) {
                fb[y * w + x] = randcol;
            }
        }
    }
}

在我测量统计数据的地方，我认为在渲染三角形、进行所有测试等过程中实际花费的时间最长。碰巧当我使用给定数量的三角形运行程序时，我得到以下渲染时间:

74 ms

但是当我注释掉写入图像缓冲区的行时，我得到:

5 ms

明确地说，我这样做:

if (pixelOverTriangle(...) {
    // fb[y * w + x] = randcol;
}

事实上，超过 90% 的时间都花在了写入图像缓冲区上!

我不得不说我尝试优化用于访问数组中元素的索引的计算方式，但这不是时间流逝的地方。时间进入实际将变量复制到缓冲区的右边(无论如何看起来)。

我对这些数字感到非常惊讶。

所以我有几个问题:

是否符合预期？
我做错了什么吗？
我可以让它变得更好吗？我可以使用什么技术来优化它？

最佳答案

内存读/写比 C++ 看起来要多得多。通常情况下，您的处理器会缓存内存块以便快速访问；这极大地提高了连续内存中数据的性能:例如数组、结构和堆栈。但是，在尝试访问尚未缓存的内存(缓存未命中)时，处理器必须缓存一个新的内存块，这需要更长的时间(几分钟甚至几小时扩展到秒长周期)。通过访问长内存块的任意段(例如您的图像)，您实际上可以保证连续的缓存未命中。

更糟糕的是，计算机内存 (RAM) 实际上位于虚拟页面上，这些页面一直在物理内存中换入和换出。如果你的图像足够大，可以跨越多个内存页(通常每个大约 4kb)，那么你的操作系统实际上是从辅助存储(你的硬盘驱动器)加载和卸载数据，你可以想象这比直接从内存读取花费的时间要长得多.

我找到了 an article来自另一个关于缓存性能的 stackoverflow 问题，它可能比我更好地回答你的问题。确实，重要的是要了解内存读/写实际上在做什么，以及它如何显着影响性能。

关于c++ - 写入内存缓冲区时的性能损失 (C++)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28286308/

24

4

0

文章推荐： Javascript 多人游戏 - 服务器端验证。

文章推荐： javascript - jQuery UI slider - 它看起来像这样吗？

文章推荐： C++ 入门第 5 期 1.4.4

文章推荐： C++:数组和 sizeof

javascript - 使用流异步读取文件时如何同步处理每一行/缓冲区
这个问题在这里已经有了答案: Possible to make an event handler wait until async / Promise-based code is done? (2
emacs - 夫妇一起在emacs中的Windows/缓冲区？
我经常有多个运行的进程(R，Python，eshell/shell)，对于每个进程，我经常都有一个相关的脚本，可以从中发送摘要。为此，我通常将每个框架垂直地分成两个窗口，以便脚本文件(例如.py)位于
关闭缓冲区后显示的 Emacs 缓冲区
如何修改 emacs 在关闭缓冲区后选择要显示的缓冲区的方式？当我有多个列显示相同的缓冲区，然后在其中一个缓冲区中打开另一个文件，然后关闭新打开的缓冲区时，它不会切换回前一个缓冲区，而是切换到另一个
vim 复制命令到剪贴板/缓冲区
如何将 ex 命令复制到剪贴板或粘贴到缓冲区？在 Windows 上使用 gvim。最佳答案 windows剪贴板可以通过the buffer + 访问.因此，可以使用 + 将剪贴板粘贴为前命令。
来自多个变量的 javascript 缓冲区
在 javascript 中如何以比以下更简单的方式获取 b 缓冲区？ var num=6553599 var a = new Buffer(4); a.writeInt32LE(num)
OpenGL - 缓冲区、着色器
每次我在 Google 上搜索有关 OpenGL 编程的文章时，我都会找到一些文章，但似乎所有文章都提到了着色器和缓冲区。那些是什么？你能解释其中的一些吗: 深度缓冲区模板缓冲区像素着色器帧缓冲
java - Java中的流、缓冲区
我有java考试，当我学习时，我看到了这个练习，我尝试解决它，但我发现一些困难，所以请帮助我考虑实用程序中方法的以下注释、 header 和部分代码名为 Atbash 的加密类。 /**
OpenGL - 缓冲区、着色器
每次我在 Google 上搜索有关 OpenGL 编程的文章时，我都会找到一些文章，但似乎所有文章都提到了着色器和缓冲区。那些是什么？你能解释其中的一些吗: 深度缓冲区模板缓冲区像素着色器帧缓冲
OpenGL 缓冲区 - 跨步与紧密封装
对于每个属性使用跨步顶点缓冲区与紧密打包缓冲区有何优缺点？我的意思是例如: 步幅:xyzrgb xyzrgb xyzrgb 紧:xyzxyzxyz rgbrgbrgb 乍一看，使用步幅时您似乎可以轻松
Java - 缓冲区 - 我的代码在读取时跳过文本文件的最后一行
我正在尝试将文本文件中每行的数字读取到 ArrayList 中。当我执行以下函数时，它总是跳过最后一个元素。有人可以帮我吗？因为我在这里没有遇到问题，因为它读取直到缓冲区为空，所以他应该在到达 Fil
将结构复制到 char 缓冲区
#include #include int main () { time_t time_raw_format; struct tm * ptr_time; char *buff
将结构复制到 char* 缓冲区
基本上我有一个包含不同类型数据的自定义结构。例如: typedef struct example_structure{ uint8_t* example_1[4]; int example_2[4];
Android ListView 缓冲区
我之前的列表实现是一个简单的 LinearLayout，位于一个装满我的项目的 ScrollView 中。我切换到 ListView 的 Android 实现以简单地使用 CursorAdapter
javascript - 响应式框架中的滑动窗口/缓冲区
我想创建一个可变长度的输入事件窗口/缓冲区，当它接收到额外的事件时会变长。这是为了实现“键入时搜索”功能。我想捕获点击，但为了不给服务器造成压力，我想明智地进行服务调用。我想到的逻辑是缓冲击键，从
复制 yuv420 缓冲区
我想将 yuv420P 像素写入缓冲区而不是二进制文件。假设我在指针中存储了 luma 、 Cb 和 Cr。 luma = output_pixel.luma; cb = output_pixel.c
具有并发读者的 Golang 缓冲区
我想在 Go 中构建一个支持多个并发读取器和一个写入器的缓冲区。所有写入缓冲区的内容都应由所有读者读取。允许新读者随时加入，这意味着已经写入的数据必须能够为迟到的读者回放。缓冲区应满足以下接口(in
没吃透Netty 缓冲区，还能算得上Java老司机？
本文转载自微信公众号「小明菜市场」，作者小明菜市场。转载本文请联系小明菜市场公众号。前言 Java NIO 需要理解的主要有缓冲区，通道，选择器，这三个主要的部分。基础
NIO 数据存储结构——缓冲区 Buffer
一点睛 NIO，可以称为 New IO 或 Non Blocking IO，是在 JDK 1.4 后提供的新 API。传统的I/O 是阻塞式的 I/O、面向流的操作；而 NIO 是非阻塞 I/O 、
vim - 如何切换到包含特定模式的 vim 缓冲区
我正在寻找一种切换到包含搜索文本的缓冲区的方法。例如。如果我打开了 100 个缓冲区，我想切换到一个包含 'fooBar = 1' 的缓冲区最佳答案我写了一个 Vim 插件来做到这一点:buff
video - 将帧插入 FFmpeg 缓冲区
我正在尝试将提取的视频帧(我使用 ffmpeg)推送到 FFMPEG 缓冲区中。我已经查看了 ffmpeg 的缓冲区源文件，例如 buffersrc.c 和 fifo.c，以确定我是否可以这样做，但我

首页

博学

6Ren·AI

商城

c++ - 写入内存缓冲区时的性能损失 (C++)