c++ - 为什么 unordered_map "find + insert"比 "insert + check for success"快？-6ren

c++ - 为什么 unordered_map "find + insert"比 "insert + check for success"快？

转载作者：IT老高更新时间：2023-10-28 22:12:21

25

4

我使用 unordered_map 作为稀疏 3D 数组 (128 x 128 x 128) 将值插入到网格中，前提是网格单元仍然空闲。

到目前为止，我总是使用 find() 检查单元格是否空闲，如果是，那么我使用 insert() 或 emplace() 添加了一个元素。现在我发现我可以使用 insert 和 emplace 的返回值来检查元素是否已添加，或者 map 中是否已经存在具有相同键的元素。我认为这可以提高性能，因为我可以完全删除 find 的使用。

事实证明，不是通过插入而不查找来提高性能，而是性能实际上下降了，我不知道为什么。

我已将我的应用程序简化为这个示例，其中点是随机生成的，然后插入到网格中。

#include <unordered_map>
#include <random>
#include <chrono>
#include <iostream>
#include <math.h>
#include <algorithm>
#include <string>

using std::cout;
using std::endl;
using std::chrono::high_resolution_clock;
using std::chrono::milliseconds;
using std::chrono::duration_cast;
using std::unordered_map;

int num_elements = 5'000'000;


void findThenInsert(){
    cout << endl << "find and emplace" << endl;

    auto start = high_resolution_clock::now();

    std::mt19937 gen(123);
    std::uniform_real_distribution<> dis(0, 128);

    unordered_map<int, int> grid;
    int count = 0;
    for(int i = 0; i < num_elements; i++){
        float x = dis(gen);
        float y = dis(gen);
        float z = (cos(x*0.1) * sin(x*0.1) + 1.0) * 64.0;

        int index = int(x) + int(y) * 128 + int(z) * 128 * 128;
        auto it = grid.find(index);
        if(it == grid.end()){
            grid.emplace(index, count);
            count++;
        }
    }

    cout << "elements: " << count << endl;
    cout << "load factor: " << grid.load_factor() << endl;

    auto end = high_resolution_clock::now();
    long long duration = duration_cast<milliseconds>(end - start).count();
    float seconds = duration / 1000.0f;
    cout << seconds << "s" << endl;
}


void insertThenCheckForSuccess(){
    cout << endl << "emplace and check success" << endl;

    auto start = high_resolution_clock::now();

    std::mt19937 gen(123);
    std::uniform_real_distribution<> dis(0, 128);

    unordered_map<int, int> grid;
    int count = 0;
    for(int i = 0; i < num_elements; i++){
        float x = dis(gen);
        float y = dis(gen);
        float z = (cos(x*0.1) * sin(x*0.1) + 1.0) * 64.0;

        int index = int(x) + int(y) * 128 + int(z) * 128 * 128;
        auto it = grid.emplace(index, count);
        if(it.second){
            count++;
        }
    }

    cout << "elements: " << count << endl;
    cout << "load factor: " << grid.load_factor() << endl;

    auto end = high_resolution_clock::now();
    long long duration = duration_cast<milliseconds>(end - start).count();
    float seconds = duration / 1000.0f;
    cout << seconds << "s" << endl;
}

int main(){

    findThenInsert();
    insertThenCheckForSuccess();

}

在这两种情况下， map 的大小都是 82901，所以我假设结果完全相同。

find and emplace:   0.937semplace then check: 1.268s

最佳答案

问题在于 emplace 的规范对于有效的关联容器，即使在失败情况下也需要分配；这种分配和重新分配的成本在 find-then-insert 策略中占主导地位。

这是因为 emplace指定为 emplace-construct value_type (即 pair<Key const, T> )来自其转发的参数；只有在构建了该对后，它才能对 key 进行哈希处理以检查它是否已经存在。 (它不能只接受第一个参数，因为它可能是 std::piecewise_construct 。)它也不能构造 pair在自动存储中，然后将其移动到节点中，因为 emplace未指定需要可复制甚至可移动的 value_type ，因此它必须在每次调用时执行潜在的昂贵节点分配。 (请注意，有序关联容器也有同样的问题，但与分配成本相比，探测的 O(log n) 成本更为显着。)

除非您的插入预计在大多数情况下都能成功，否则最好使用 find-then-emplace 而不是 emplace-then-test。您也可以使用 insert ，只要您确定您调用的是 value_type重载而不是转发到 emplace 的模板.

这是(可能)在 C++17 中修复的，它(应该)有 try_emplace ，具有与 emplace 相似的语义，但在失败情况下提高了性能。 (语义上的区别是映射类型在失败情况下不是 emplace-constructed；这使得例如将 unique_ptr 存储为映射类型成为可能。)

关于c++ - 为什么 unordered_map "find + insert"比 "insert + check for success"快？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31804025/

25

4

0

文章推荐： c++ - 基类中的私有(private)静态成员

文章推荐： python - 如何子类化 Pandas DataFrame？

html - 使用 [checked] 或 [checked ="checked"]
这个问题在这里已经有了答案: What's the proper value for a checked attribute of an HTML checkbox? (10 个答案) 关闭 8 年
jquery - 自定义复选框 : how to check whether check box is checked or not
我使用这个制作了自定义复选框: enter link description here 也可在 stackoverflow 上获得:enter link description here 但我正在尝试
javascript - .checked = true 或 setAttribute ("checked", "checked") 未附加
我需要使用 CSS“checkbox-hack”来实现滑动菜单指示器效果，我唯一的方法是通过 JavaScript 附加输入元素。我被迫通过在线工具 MonoSolutions 执行此操作，并且我受到
javascript - Bootstrap : how to check if an elment is checked and set it to disable if checked
此代码运行良好，但缺少一些我需要的东西。基本上，如果输入有一个 checked="checked" 属性，它应该使其他两个元素保持禁用状态。如果未选中，则元素已启用。这是我在 jsFiddle 上的
tfs - Visual Studio TFS check out 缺少 "Check out" check out 类型
当我的人 checkout 文件时，我希望他们将其锁定，以便其他人也无法进行更改，我从这篇文章中看到:http://msdn.microsoft.com/en-us/library/jj155783.
c# - Check.Assert()、Check.Ensure() 和 Check.Require() 有什么作用？
请告诉我这些函数的作用。最佳答案这些是基于框架的、与语言无关的方法，用于在 .NET 中定义代码契约。虽然某些语言(如 spec# 和 Delphi Prism)对代码契约具有一流的语言支持，但这
javascript - $ ('.input:checked' ) 的行为不同于 $ ('.input[checked=checked]' )
假设以下场景:您有 2 个单选按钮，它们具有相同的名称，并且都被选中(我知道这是无效的): 为什么下面两个选择器的行为不同？ $('.input:checked').size(); // retu
jquery - .attr ('checked' ,'checked' )不起作用
我正在尝试收听广播。以下均不起作用: [编辑] $('selector').attr('checked','checked'); $('selector').attr('checked',true);
dart - 参数类型“CheckIng”不能分配给参数类型“(()-> Check In”
我实际上在努力理解此类型错误。任何人都知道我如何更正代码？谢谢 CheckIn checkin1 = new CheckIn(location1, dt); CheckInMonths checkI
jquery - .attr ('checked' 、 'checked' )无法按预期工作
我有这段代码，但不起作用。 .on("click","span.name", function selectThisName(e) { if (e.altKey) {
安卓 Espresso : checking for a checked checkbox
我现在是 Espresso 的新手，我遇到了这个异常: android.support.test.espresso.AmbiguousViewMatcherException: 'with id: a
html - 选项更改时单选按钮 "Checked=checked"不更改
我已经创建了一个基本的 2 单选按钮表单，如下面的示例所示。观察浏览器渲染，我们看到元素 1 被选中。我们检查元素 1 和元素 2。当我点击元素 2 时，我希望元素 1 的 checked=che
javascript - jquery attr ('checked' ,'checked' ) 只工作一次
我在查找以下 jquery/checkbox 行为的原因时遇到问题。 $( this.obj + ' table.sgrid-content > thead > tr > th > input.sel
azure 逻辑应用: not corrently checking empty check
以下逻辑应用在上午 10 点触发并运行 SQL Server 查询。从图片中可以看出，结果集是空的。条件检查检查查询的结果集是否为空。 (第二张图) 这仍然如何转化为 True？结果显然是空的。最
java - 什么更快 : equal check or sign check
我想知道哪种操作更快: int c = version1.compareTo(version2); 这个 if (c == 1) 或者这个 if (c > 0) 符号比较是否只使用一位检查，而相等比较
Angular : $pristine for ng-check checked inputs
我有一个包含大约 100 个问题的表单，每个问题都有一个单选按钮和一些复选框，因此我需要用户能够保存表单并在以后加载它。我还需要检查用户在此 session 中更改了哪些。本题解决问题:How ca
python - Tkinter问题: checking one checkbox checks all of them
我正在编写一个小程序，需要用户决定一些 bool 值。我已经制作了复选框来处理这一部分，但问题是每次我选中或取消选中一个复选框时，所有其他复选框都会跟随。我在网上搜索过，但我找到的唯一解释( pyt
jquery - 为什么 .attr ('checked' ,'checked' ) 不会设置？
我有以下代码片段(我使用的是 jQuery 1.4.2): $.post('/Ads/GetAdStatsRow/', { 'ad_id': id }, function(result) {
javascript - checkbox 有 checked 属性但不显示 checked
我的代码发生了一些奇怪的事情。我有两个按钮，其中一个带有 .add 和 .remove 类，有一个复选框会根据按下哪个按钮而打开和关闭，因此如果您使用删除按钮删除，则选中的复选框将被选中，否则复选框将
android - 如何将列表中的所有复选框 'check' 改为 'check' 单个复选框？
我陷入了一种情况，我必须通过“选中”工具栏中的复选框来“选中”列表中存在的所有复选框。这是创建复选框列表的代码:- itemTpl: 'checked="checked" /> {groupName

首页

博学

6Ren·AI

商城

c++ - 为什么 unordered_map "find + insert"比 "insert + check for success"快？