c++ - 固定大小 vector 的C++有效增长 vector-6ren

c++ - 固定大小 vector 的C++有效增长 vector

转载作者：行者123 更新时间：2023-11-30 03:16:07

在我的程序中，我有一个std::vector<std::array<float, n_channels>> vecvec，其中n_channels是在编译时已知的常量整数。在程序中，vecvec随着时间增长。

现在，我想解除约束，即必须在编译时知道n_channels，因此我将定义更改为std::vector<std::vector<float>> vecvec。 n_channels仍然是一个固定值，该值在构造vecvec之前就已知道(vecvec的所有元素都具有相同的长度)。

但是，现在我的程序突然慢了2.5倍。

我认为这是因为vecvec的内存突然碎片化了，因为它并不“知道” vecvec的每个元素都具有相同的大小。

有什么办法我也可以吃蛋糕吗？

最佳答案

你也想吃蛋糕吗？今天实现自己的可调整行大小的二维数组类!

您可以编写自己的2D数组类。通过使行在内存中连续，您可以获得使用std::vector<std::array<...>>的所有好处，但没有固定的编译时大小!为了简化实现，您可以使其包装std::vector。

为了实现全部功能，我们还应该创建两个“helper”类。其中一个代表数组中的一行，另一个代表该行的迭代器。当我们遍历2D数组时，我们将遍历数组的行。

行类

这很简单。它只包含一个开始和结束指针。数组是连续存储的，因此我们实际上并不存储Row，但是拥有它们仍然很方便，因此我们有一个要迭代的类型。

由于Row类仅表示矩阵中一行的 View ，因此 Row类不应分配或删除任何内存。 此外，我使Row类的所有成员函数不变，以便可以对直接从Row返回的RowIterator进行操作。

template<class T>
struct Row {
    T* _start;
    size_t _size;
    // These are const because if we need the elements to be const
    // We just make T const
    T* begin() const noexcept { return _start; }
    T* end() const noexcept { return _start + _size; }
    size_t size() const noexcept { return _size; }
    T& operator[](size_t index) const noexcept {
        return _start[index]; 
    }
    // Implicitly convertible to Row<T const>
    operator Row<T const>() const noexcept {
        return {_start, _size}; 
    }
};

RowIterator类

这只是实现了随机访问迭代器的基本功能。您可以向前，向后移动，向其中索引，从中添加或减去整数，等等。例如，如果我减去5，它将向后移动5行。

template<class T>
struct RowIterator {
    using value_type = Row<T>; 
    using element_type = Row<T>; 
    using reference_type = Row<T>; 
    using const_reference_type = Row<T>;
    // Add other iterator traits as needed  


    Row<T> current; 
    void operator++() noexcept {
        current._start += current._size; 
    }
    void operator--() noexcept {
        current._start -= current._size; 
    }
    RowIterator<T> operator+(intptr_t rows) const noexcept {
        return { Row<T>{current._start + rows * current._size, current._size } }; 
    }
    RowIterator<T> operator-(intptr_t rows) const noexcept {
        return { Row<T>{current._start - rows * current._size, current._size } }; 
    }
    RowIterator<T>& operator+=(intptr_t rows) noexcept {
        current._start += rows * current._size; 
        return *this; 
    }
    RowIterator<T>& operator-=(intptr_t rows) noexcept {
        current._start -= rows * current._size; 
        return *this; 
    }
    Row<T> operator*() const noexcept {
        return current; 
    }
    bool operator==(RowIterator<T> other) const noexcept {
        return current._start == other.current._start && current._size == other.current._size; 
    }
    bool operator!=(RowIterator<T> other) const noexcept {
        return current._start != other.current._start || current._size != other.current._size; 
    }
    Row<T> operator[](intptr_t index) {
        return (*this + index).current; 
    }
};

vector2D类

2D vector 类将其元素连续存储在 vector 中，但是要访问它们或对其进行迭代，它会返回 Row和 RowIterator。因为 Row只是两个值(一个指针和一个大小)，所以这样做确实很便宜，并且编译器应该能够轻松地对其进行优化。

请注意，为了保持const的正确性，我使用了 Row<T const>，它创建了带有常量元素的 Row。 (这大大简化了 Row的实现)。

template<class T>
class vector2D : private std::vector<T> {
    size_t rows; 
    size_t columns; 
    using std::vector<T>::data; 

   public:
    size_t size() const noexcept {
        return rows; 
    }
    // Gets a particular row
    Row<T> operator[](size_t index) noexcept {
        return { data() + columns * index, columns }; 
    }
    // Get a particular row when const
    Row<T const> operator[](size_t index) const noexcept {
        return { data() + columns * index, columns }; 
    }
    RowIterator<T> begin() noexcept {
        return { Row<T>{ data() , columns } }; 
    }
    RowIterator<T> end() noexcept { 
        return { Row<T>{ data() + columns * rows, columns } }; 
    }
    RowIterator<T const> begin() const noexcept {
        return { Row<T const>{ data() , columns } }; 
    }
    RowIterator<T const> end() const noexcept { 
        return { Row<T const>{ data() + columns * rows, columns } }; 
    }

    template<size_t N>
    void push_back(std::array<T, N> const& arr) {
        if(arr.size() == columns) {
            insert(end(), arr.begin(), arr.end()); 
            rows++; 
        }
        else
            throw std::invalid_argument("Bad number of columns"); 
    }

    void push_back(Row<T> arr) {
        if(arr.size() == columns) {
            insert(end(), arr.begin(), arr.end()); 
            rows++; 
        }
        else
            throw std::invalid_argument("Bad number of columns"); 
    }
    void push_back(Row<T const> arr) {
        if(arr.size() == columns) {
            insert(end(), arr.begin(), arr.end()); 
            rows++; 
        }
        else
            throw std::invalid_argument("Bad number of columns"); 
    }
    void push_back(std::initializer_list<T> arr) {
        if(arr.size() == columns) {
            insert(end(), arr.begin(), arr.end()); 
            rows++; 
        }
        else
            throw std::invalid_argument("Bad number of columns"); 
    }
    vector2D(size_t rows, size_t columns)
        : std::vector<T>(rows * columns)
        , rows(rows)
        , columns(columns) {}

};

基准结果

Run the benchmark here

有了基准测试结果， vector2D与使用数组 vector 一样快!!!

考试

该测试分为两个部分:

用值

填充2D数组

对所有值

求和

为了使事情尽可能通用，这些是我使用的功能。它们可以与 std::vector<std::vector<...>>， std::vector<std::array<...>>或我们自己的 vector2D一起使用!

template<class List>
auto calculateSum2D(List const& list) {
  using elem_t = std::decay_t<decltype(list[0][0])>;
  elem_t initial = 0;

  for(auto const& row : list) {
    for(auto& elem : row) {
      initial += elem;
    }
  }
  return initial;
}

template<class List>
void fill(List& list, int rows, int cols) {
  for(int i = 0; i < rows; i++) {
    for(int j = 0; j < cols; j++) {
      list[i][j] = i * j; 
    }
  }
}

结果

我们使用Quickbench来获得结果， vector2D的速度比使用vectors的速度快 4.5 倍!

这些结果是通过使用快速基准编写的相应功能获得的!
// Benchmark using a vector of vectors static void sumVector(benchmark::State& state) { // Code inside this loop is measured repeatedly for (auto _ : state) { std::vector<std::vector<double>> vect(rows, std::vector<double>(cols)); fill(vect, rows, cols); auto sum = calculateSum2D(vect); benchmark::DoNotOptimize(sum); } } // Register the function as a benchmark BENCHMARK(sumVector); // Benchmark using a vector of arrays static void sumArray(benchmark::State& state) { // Code inside this loop is measured repeatedly for (auto _ : state) { std::vector<std::array<double, cols>> vect(rows, std::array<double, cols>()); fill(vect, rows, cols); auto sum = calculateSum2D(vect); benchmark::DoNotOptimize(sum); } } // Register the function as a benchmark BENCHMARK(sumArray); // Benchmark using vector2D implementation static void sumvector2D(benchmark::State& state) { // Code inside this loop is measured repeatedly for (auto _ : state) { vector2D<double> vect(rows, cols); fill(vect, rows, cols); auto sum = calculateSum2D(vect); benchmark::DoNotOptimize(sum); } } // Register the function as a benchmark BENCHMARK(sumvector2D);

基准v2:无重复分配

View benchmark 2 here

事实证明，在初始基准测试中，大部分成本来自重复分配(在所有情况下，每次基准测试迭代都会重新分配对象)。为了解决这个问题，我将声明移出了循环，因此声明只会出现一次。我还调整了行和列的数量，以便有更多的行和更少的列，以便获得一种更实际的方案，其中整个内容都不适合缓存。

再次，vector2D和vector<array>的性能几乎相同，但是这次vector<vector>的性能要好得多，并且差距并不那么大。

加速差异的原因是这一次，唯一的差异是缓存局部性差的结果，因为每个对象只分配了一次。

概要

根据基准测试结果，vector2D应该使您的性能恢复到最初的水平。由于您的代码可能包含分配和用法的混合，因此您得到的结果介于两个基准之间( vector 的 vector 慢2.5倍)。因为vector2D是连续的，并且避免了困扰 vector 载体方法的重复堆分配，所以它应该和数组 vector 一样快。

关于c++ - 固定大小 vector 的C++有效增长 vector ，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56604016/

文章推荐： android - 在android系统上测试屏幕

文章推荐： android - Android中的多列自定义ListView

文章推荐： android - 将用户 ID 发送到 Google Analytics

文章推荐： java - 在 Netbeans 中构建 Maven 项目时出现错误？

c - 大小(数组)/大小(整数)
这个问题在这里已经有了答案: C sizeof a passed array [duplicate] (7 个回答) 8年前关闭。在一个函数中，我声明了一个数组: int char_count_ar
linux - 为什么文件系统有自己的 block 大小，而不是使用硬盘 block 大小？
简而言之，文件系统如何与 block 设备通信？最佳答案我对 block 大小不太了解。我认为 ext4(Linux)的文件系统的 block 大小是 4KB，考虑到现代处理器的页面大小(4KB)
mysql - tinyint(大小)，varchar(大小): "size" explaination
我知道 tinyint(1) 和 tinyint(2) 具有相同的存储空间范围。唯一的区别是显示宽度不同。这是否意味着 tinyint(1) 将存储所有类型的整数但只正确显示 0 到 9 的范围？而
c++ - 大小 8 的无效读取，大小 8 的无效写入 (Valgrind)
今晚我已经研究了以下代码几个小时，但我只是摸不着头脑。当使用函数从标准输入填充数组时，我不断收到“大小 8 的无效写入”和“大小 8 的无效读取”。如有任何帮助，我们将不胜感激...我知道 Sta
c - 大小 8 的无效读取，大小 8 的无效写入，C
我有一个 valgrind 错误，我不知道如何摆脱它们: ==5685== Invalid read of size 8 ==5685== at 0x4008A1: main (in /home
Hadoop block 大小 vs 拆分 vs block 大小
我对 Hadoop 的概念有点困惑。 Hadoop block 大小、拆分大小和 block 大小之间有什么区别？提前致谢。最佳答案 block 大小和 block 大小相同。拆分大小可能与
javascript - 超过 localStorage 配额(localStorage 大小!= 文件下载大小)& 如何检查 localStorage 大小
我想不出一个好的标题，所以希望可以。我正在做的是创建一个离线 HTML5 webapp。 “出于某些原因”我不希望将某些文件放在缓存 list 中，而是希望将内容放在 localStorage 中。
xamarin - 减少 Xamarin.Forms 中的 APK 大小，APK 大小 80MB
无法将 xamarin apk 大小减少到 80 MB 以下，已执行以下操作: 启用混淆器配置:发布平台:事件(任何 CPU)。启用 Multi-Dex:true 启用开发人员检测(调试和分析)
python - 读取多个 csv 文件(大小 mxm)并加载为 n 维数组(大小 nxmxm)(不连接)
我正在开发一个程序，需要将大量 csv 文件(数千个)加载到数组中。 csv 文件的尺寸为 45x100，我想创建一个尺寸为 nx45x100 的 3-d 数组。目前，我使用 pd.read_csv(
react-native - Flutter apk/ipa 大小 vs React Native apk/ipa 大小
Hello World 示例的 React Native APK 大小约为 20M (in recent versions)，因为支持不同的硬件架构(ARMv7、ARMv8、X86 等)，而同一应用程
python - 将 n 个元素(大小 = 2 字节，十进制)的列表拆分为 2n 个元素(大小 = 1 字节，十六进制)
我有一个包含 n 个十进制元素的列表，其中每个元素都是两个字节长。可以说: x = [9000 , 5000 , 2000 , 400] 这个想法是将每个元素拆分为 MSB 和 LSB 并将其存储在
GtkTextView 大小
如何设置 GtKTextView 的大小？我想我不能使用 gtk_widget_set_usize。最佳答案您不能直接控制小部件的大小，而是由其容器完成。您可以使用 gtk_widget_set_
具有函数的结构的c++大小
这个问题在这里已经有了答案: c++ sizeof() of a class with functions (7 个答案) 关闭 5 年前。结果是 12。 foobar 函数存储在内存中的什么位置
image - 为什么图像序列比源视频大(大小)？
当我在 ffmpeg(或任何其他程序)中使用这样的命令时: ffmpeg -i input.mp4 image%d.jpg 所有图像的组合文件大小总是比视频本身大。我尝试减少每秒帧数、降低压缩设置、模
clojurescript 高级编译 - 大小
我是 clojurescript 的新手。高级编译后出现“77 KB”的javascript文件是否正常？我有一个 clojurescript 文件: 我正在使用 leinigen: lein c
Qt QPixmap 大小
我想要一个 QPixmap尺寸为 50 x 50。我试过 : QPixmap watermark(QSize(50,50)); watermark.load(":/icoMenu/preparati
卷积层的 tensorflow 大小
我正在尝试从一篇研究论文中重新创建一个 cnn，但我对深度学习还是个新手。我得到了一个大小为 32x32x7 的 3d 补丁。我首先想执行一个大小为 3x3 的卷积，具有 32 个特征和步幅为 2。
iPhone如何在旋转设备时正确调整 View 大小
我一直在尝试调整 View Controller 内的 View 大小，但到目前为止没有运气。基本上，我的 View 最底部有一个按钮，当方向从纵向更改为横向时，该按钮不再可见，因为它现在太靠下了。
javascript - 上传前检查图像尺寸/大小
如何使用此功能检查图像的尺寸？我只是想在上传之前检查一下... $("#LINK_UPLOAD_PHOTO").submit(function () { var form = $(this);
二叉搜索树上的 JavaScript 大小
我用 C++ 完成了这个，因为你可以通过引用传递参数。我无法弄清楚如何在 JavaScript 中执行此操作。我的代码需要更改什么？我的输出是1 this.sizeOfBst = function()

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

c++ - 固定大小 vector 的C++有效增长 vector