c++ - 恒定大小字符串的高效 HashMap-6ren

c++ - 恒定大小字符串的高效 HashMap

转载作者：塔克拉玛干更新时间：2023-11-02 23:36:55

24

4

我需要将仅包含字母数字值(A-Z、0-9，无小写字母)的固定大小的字符串映射到其他字符串。 unordered_map 变得非常大(数千万个键)，而映射值来自一组几千个字符串。在进行性能分析时，我发现大部分时间都花在了将新值插入 map (operator[]) 上，而且清除 map 也需要很长时间。

std::unordered_map<std::string, std::string> hashMap;
while (...){
    ...
    hashMap[key] = value;  // ~50% of program time is spent here
    ...
}

hashMap.clear();  // Takes a very long time, at this point hashMap.size() > 20,000,000

我的想法是字符串分配/取消分配非常慢，散列和插入映射也是如此。有什么优化建议吗？请记住， key 大小是恒定的，其内容限制为一组 36 个字符，并且映射值来自一个有限的集合。除了字符串和 unordered_map，我愿意使用不同的容器/数据类型。

更新

根据 Baum Mit Augen 的建议，我将我的 key 类型更改为 unsigned long long 并制作了一个将基数 36 转换为十进制的函数:

unsigned long long ConvertBase36(const char* num)
{
    unsigned long long retVal = 0;

    for (int i = 0; i < 12; i++)
    {
        unsigned int digit = 0;
        char currChar = num[i];
        if (currChar <= '9')
        {
            digit = currChar - '0';
        }
        else
        {
            digit = currChar - 'A' + 10;
        }

        retVal *= 36;
        retVal += digit;
    }

    return retVal;
}

这使我的整个程序运行时间提高了大约 10%。然后我再次尝试使用 unordered_map 保留函数来查看它是否有任何不同，但它没有。尝试使用 map 而不是 unordered_map 的效果差了大约 10%，因此我恢复了该更改。最后用 unsigned int 替换字符串值使事情变得更快一些。

最佳答案

两个不相关的建议，但都与 std::unordered_map::reserve 有关.

首先，由于您的无序映射包含 10 毫秒的元素，因此在您插入时可能会进行许多重新分配/重新散列。一开始，您可能希望保留 10 毫秒的条目。

自

the mapped values are from a set of a few thousand strings

您应该能够将值本身存储在辅助 unordered_set 中，您首先 reserved 到足够大的东西以确保没有迭代器在 insert 时失效s - 请参阅 invalidation guarantees for unordered associative containers .

您的(主要)unordered_map 然后可以将 string 映射到 std::unordered_set::const_iterator。

关于c++ - 恒定大小字符串的高效 HashMap ，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39076241/

24

4

0

文章推荐： c++ - 给定一个整数 N，按字典顺序打印从 1 到 N 的数字

文章推荐： java - IllegalArgumentException:文件包含路径分隔符 Android

文章推荐： c++ - 无法在 TDM-GCC 的 typeid 中使用 declval

hashmap - 以忽略 HashMap 值的通用方式公开 HashMap
我有不同的结构，它们都包含一个 HashMap与 String作为键，但具有不同的值类型。例如，一个结构有一个类型为 HashMap 的成员, 另一个将有一个 HashMap 类型的成员, 等等。我
JAVA HashMap 2D，无法获得制作 2D HashMap 的正确方法，我的意思是将 HashMap 转换为另一个 HashMap
我想制作一个包含学生姓名和科目的板，每个学生在每个科目中都有一个成绩(或者没有..他可以离开考试而不写，然后他的案子将是空的)。我只想使用 HashMap。我的意思是，它会是这样的: HashMap>
hashmap - 八叉树的动态 HashMap
是否有内存和速度高效的方法来在 HashMap 中动态存储唯一键:值对？ key 保证是唯一的，但它们的数量经常变化。插入和删除必须很快。我所做的是包含有符号距离场的八叉树(非线性/完整)。八叉树经
hashmap - 为什么 LinkedList 作为 HashMap 的存储桶实现而不是另一个 Hashmap？
有谁知道为什么选择通过 LinkedList 而不是另一个 Hashmap 来实现 HashMap 的存储桶。如果桶本身变成了 HashMap，那么 contains 或 get 的时间复杂度似乎是
hashmap - 无法将字符串以外的值添加到嵌套 HashMap
我想创建一个具有嵌套结构的 HashMap，就像这个复杂的示例: { type: boy name: Phineas father: type: man
hashmap - 库中的全局可变 HashMap
这个问题在这里已经有了答案: How do I create a global, mutable singleton? (7 个答案) 关闭 7 年前。我想要一个可扩展的字典，将 Object 与
java - 如何使用其他 HashMap 的对象在 HashMap 中定义 HashMap
HashMap> hm = new HashMap>(); hm.put("Title1","Key1"); for(int i=0;i hm1 = new H
java - 无法将 HashMap 类型转换为 HashMap 本身且内部包含 HashMap 对象的对象
我必须修改当前代码以适应 Spring MVC。我有 HashMap hashmap = new HashMap(); request.setAttribute("dslrErrors", hashm
java - 检查数组的长度并检查 HashMap 键是否在 HashMap 中(Java、Arrays、HashMap)
我正在尝试进行一些错误捕获。错误应该检查数组的长度是否小于 2，并检查 HashMap 是否包含用户输入的键。捕获的错误必须仅使用 if 语句，并且必须使用 .length() 方法，并且必须使用
java - 奇怪的 HashMap 异常(HashMap$Node 无法转换为 HashMap$TreeNode)
在 stackoverflow 上提出另一个问题后，(Java- Why this program not throwing concurrent Modification exception)我开始
java - 如何使用 DozerBeanMapper 将具有对象数组列表的 HashMap(列表是 HashMap 中的值)映射到另一个 HashMap？
我有两个类，想使用 org.dozer.Mapper( http://dozer.sourceforge.net/ ) 将 Female 对象的属性映射到 Male 对象。第一类是: public
hashmap - 面试问题:什么是 HashMap ？
As it currently stands, this question is not a good fit for our Q&A format. We expect answers to be
hashmap - Kotlin HashMap 使用数组包含键
是否有任何方法可以检查 HashMap 是否包含一组特定的键(这些键是在数组中给出的)。当我尝试类似下面的代码时，它返回 false。 map.containsKey(arrayOf("2018-01
Java， HashMap 中的 HashMap
跟进我的问题:How To Access hash maps key when the key is an object 我想尝试这样的事情:webSearchHash.put(xfile.getPa
java - HashMap 内的 HashMap ？
我有一个可扩展的 ListView ，对于每个 child ，我需要有 4 个“额外”或字符串或其他名称来调用它:- 子标题- 描述- 链接1- 链接2 跟着教程，创建 ListView 、不同的 p
java - HashMap 内部的 HashMap
我想确保这是正确的，因为如果不正确，它可能会破坏我的应用程序。我有这个: private static HashMap> balance = new HashMap<>(); 如果我得到这样的值:
hashmap - 如何有效地从 HashMap 中查找和插入？
我想做以下事情: 为某个键查找Vec，并将其存储以备后用。如果它不存在，则为键创建一个空的 Vec，但仍将其保存在变量中。如何有效地做到这一点？自然地，我认为我可以使用 match: use st
hashmap - 如何有效地从 HashMap 中查找和插入？
我想做以下事情: 为某个键查找Vec，并将其存储以备后用。如果它不存在，则为键创建一个空的 Vec，但仍将其保存在变量中。如何有效地做到这一点？自然地，我认为我可以使用 match: use st
hashmap - 如何有效地从 HashMap 中查找和插入？
我想做以下事情: 为某个键查找Vec，并将其存储以备后用。如果它不存在，则为键创建一个空的 Vec，但仍将其保存在变量中。如何有效地做到这一点？自然地，我认为我可以使用 match: use st
hashmap - 如何有效地从 HashMap 中查找和插入？
我想做以下事情: 为某个键查找Vec，并将其存储以备后用。如果它不存在，则为键创建一个空的 Vec，但仍将其保存在变量中。如何有效地做到这一点？自然地，我认为我可以使用 match: use st

首页

博学

6Ren·AI

商城

c++ - 恒定大小字符串的高效 HashMap

更新