c++ - std::unordered_map 的哈希值

转载作者：可可西里更新时间：2023-11-01 16:38:08

25

4

根据标准，std::hash 中不支持容器(更不用说无序容器了)类(class)。所以我想知道如何实现它。我拥有的是:

std::unordered_map<std::wstring, std::wstring> _properties;
std::wstring _class;

我考虑过迭代条目，计算键和值的各个散列(通过 std::hash<std::wstring> )并以某种方式连接结果。

执行此操作的好方法是什么？如果未定义 map 中的顺序，这有什么关系吗？

注意:我不想使用 boost。

有人建议一个简单的异或，所以它会是这样的:

size_t MyClass::GetHashCode()
{
  std::hash<std::wstring> stringHash;
  size_t mapHash = 0;
  for (auto property : _properties)
    mapHash ^= stringHash(property.first) ^ stringHash(property.second);

    return ((_class.empty() ? 0 : stringHash(_class)) * 397) ^ mapHash;
}

?

我真的不确定那个简单的 XOR 是否足够。

最佳答案

响应

如果足够的话，你的意思是你的函数是否是单射的，答案是否定的。原因是你的函数可以输出的所有哈希值的集合具有基数 2^64，而你的输入空间是 < strong>大得多。然而，这并不重要，因为考虑到输入的性质，您不能拥有单射哈希函数。一个好的哈希函数具有这些品质:

它不容易翻转。给定输出 k，在宇宙的生命周期内找到满足 h(m) = k 的 m 在计算上是不可行的。
范围均匀分布在输出空间。
很难找到满足 h(m) = h(m') 的两个输入 m 和 m'

当然，这些的范围实际上取决于您是想要加密安全的东西，还是想要获取一些任意数据 block 并只向它发送一些任意 64 位整数。如果您想要加密安全的东西，那么自己编写它并不是一个好主意。在这种情况下，您还需要保证函数对输入的微小变化敏感。 std::hash 函数对象不需要密码安全。它存在于与哈希表同构的用例中。 CPP Rerefence 说:

For two different parameters k1 and k2 that are not equal, the probability that std::hash<Key>()(k1) == std::hash<Key>()(k2) should be very small, approaching 1.0/std::numeric_limits<size_t>::max().

我将在下面说明您当前的解决方案如何不能真正保证这一点。

碰撞

我将针对您的解决方案的变体提供一些我的观察结果(我不知道您的 _class 成员是什么)。

std::size_t hash_code(const std::unordered_map<std::string, std::string>& m) {
    std::hash<std::string> h;
    std::size_t result = 0;
    for (auto&& p : m) {
        result ^= h(p.first) ^ h(p.second);
    }
    return result;
}

很容易产生碰撞。考虑以下 map :

std::unordered_map<std::string, std::string> container0;
std::unordered_map<std::string, std::string> container1;
container0["123"] = "456";
container1["456"] = "123";
std::cout << hash_code(container0) << '\n';
std::cout << hash_code(container1) << '\n';

在我的机器上，使用 g++ 4.9.1 编译，输出:

1225586629984767119
1225586629984767119

关于这是否重要的问题出现了。相关的是您将多久拥有一次键和值颠倒的映射。这些冲突将发生在键和值集相同的任何两个映射之间。

迭代顺序

具有完全相同键值对的两个 unordered_map 实例不一定具有相同的迭代顺序。 CPP Rerefence 说:

For two parameters k1 and k2 that are equal, std::hash<Key>()(k1) == std::hash<Key>()(k2).

这是哈希函数的一个微不足道的要求。您的解决方案避免了这种情况，因为迭代顺序无关紧要，因为 XOR 是可交换的。

一个可能的解决方案

如果您不需要加密安全的东西，您可以稍微修改您的解决方案以消除对称性。这种方法在实践中适用于哈希表等。这个解决方案也独立于 unordered_map 中的顺序未定义的事实。它使用与您的解决方案相同的属性(XOR 的交换性)。

std::size_t hash_code(const std::unordered_map<std::string, std::string>& m) {
    const std::size_t prime = 19937;
    std::hash<std::string> h;
    std::size_t result = 0;
    for (auto&& p : m) {
        result ^= prime*h(p.first) + h(p.second);
    }
    return result;
}

在这种情况下，您在哈希函数中所需要的只是一种将键值对映射到任意好的哈希值的方法，以及一种使用交换运算组合键值对的哈希值的方法。这样，顺序并不重要。在我写的例子hash_code中，键值对哈希值只是键的哈希和值的哈希的线性组合。您可以构建更复杂的东西，但没有必要。

关于c++ - std::unordered_map 的哈希值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31098482/

25

4

0

文章推荐： c++ - gcc5.1 的新 libstdc++ 可能会分配大堆内存

文章推荐： http - 如何使用 curl 发布文件的内容

文章推荐： c++ - 重载数组的输出运算符

C++ vs vs vs
我目前正在寻找 std::map 的更好替代方案，并且遇到了帖子标题中提到的类。有人可以阐明它们之间的区别，不是在性能/API 方面，而是在它们与当前和 future 的通信标准相关的地方。最佳答案
C++ unordered_map 其中键也是 unordered_map
我正在尝试使用一个 unordered_map 和另一个 unordered_map 作为键(自定义哈希函数)。我还添加了一个自定义的 equal 函数，尽管它可能并不需要。代码没有达到我的预期，但
c++ - 访问存储在 unordered_map 值中的 unordered_map
关闭。这个问题是not reproducible or was caused by typos .它目前不接受答案。这个问题是由于错别字或无法再重现的问题引起的。虽然类似的问题可能是on-topi
c++ - 从函数返回 unordered_map 内的 unordered_map
我正在尝试从 unordered_map 中返回 unordered_map 的拷贝。下面的代码更清楚地说明了我的问题: typedef std::unordered_map Foo; typede
c++ - std::unordered_map::insert与std::unordered_map::operator []
我有一个类型为unordered_map的容器，我想确认要向 map 添加元素时应使用哪个版本。我希望它使用新呈现的旧值覆盖旧的值(如果存在)，如果不存在则仅添加它。我看到insert会在元素退出时
c++ - 将 unordered_map 设置为 unordered_map 的值
所以我试图将 unordered_map 设置为另一个 unordered_map 的值。现在我遇到了无法将值放入第二个 unordered_map 的问题。我的代码看起来像这样。 std::
c++ - 插入到 unordered_map 的 unordered_map 中？
我有一个数据结构，它是 unordered_map 的 unordered_map: typedef std::unordered_map map1; typedef std::unordered_m
c++ - std::unordered_map 包含另一个 std::unordered_map？
我们正在用 C++ 为学校开发一个游戏项目。我负责 map 对象，它将包含炸弹、玩家、墙壁和盒子等实体。我的 map 中有 3 个容器: 玩家的 std::list(多个玩家可以站在同一个盒子上)。
c++ - 检查 unordered_maps 的 unordered_map 是否包含键的最简单方法
我正在使用 unordered_maps 的 unordered_map，这样我就可以使用“多键”语法来引用元素: my_map[k1][k2]。有没有一种方便的方法可以在尝试访问之前使用相同的“多
c++ - 遍历 unordered_map cpp 的 unordered_map 中的元素
假设我有一个 unordered_map 定义如下: unordered_map> f_table; f_table[1][3] = 10; f_table[1][2] = 1; f_table[1]
C++ unordered_map operator[ ] vs unordered_map.find() 性能
我正在 interviewbit.com 上解决竞争性编程问题我基本上使用 unordered_map 来跟踪访问过的数字。当我使用 operator[] 时，我的代码无法及时执行，但是当我使用 fi
c++ - 如何在 C++ 中清除 unordered_map 的 unordered_map？
我有一张 map ，如下所示。 struct B { int b1; int b2; int b3; }; struct A { B a1; B a2; }; unordered
c++ - 如何在 C++ 中使用 unordered_maps 的 unordered_map？
我有以下数据结构问题？你能帮帮我吗？所以我的要求是在我将新数据项添加到此 map 时将此数据结构初始化为默认值。我怎样才能有效地做到这一点？对于我要添加的每个条目，我需要将 a1、a2、a3 设置
c++ - boost::unordered_map 缺少像 std::unordered_map 这样的 reserve()
对于我的下一个任务，我需要使用一个非常大的散列；因为我有一个旧的编译器，所以我不能使用 C++0x std::unordered_map。理想情况下，我需要调用 reserve 为大量元素提前腾出空间
c++ - Unordered_map 有效但 Unordered_map 无效
我不明白为什么这个简短示例中的第二个代码块无法正确编译。我的理解是 <> 中的第二个参数表示值，它不需要是唯一的。为什么第二个代码块抛出编译器错误，我需要做什么来补救它？ // Unordered M
c++ - 无法将 unordered_map 转换为 unordered_map
这段代码运行成功，结果为“Character Found”。 unordered_map mp; mp['a'] = 'b'; char b='b'; if(mp['a'] && mp['a'] ==
c++ - C++ 中 unordered_map::emplace 和 unordered_map::insert 有什么区别？
std::unordered_map::emplace和std::unordered_map::insert在C++中有什么区别？最佳答案 unordered_map::insert 将键值对复制或
c++ - 在 C++0x 标准中会有 unordered_map，这与 boost unordered_map 相比如何？
哪个更有效率？有什么好的基准吗？最佳答案 C++11 的 std::unordered_map 规范类似于基于 tr1::unordered_map 的 boost::unordered_map。话
c++ - boost::unordered_map::find 根据编译器优化级别产生不同的结果，而 boost::unordered_map::insert 产生相同的结果
使用 gcc 4.8.1 和 libboost 1.53，根据我用于编译代码的优化级别，我得到了不同的结果。作为更大程序的一部分，函数 insertValues 对相同的 a、key 和 value
c++ - 为什么我不能将 std::unordered_map 或 boost::unordered_map 与 boost::multiprecision 类型一起使用？
我正在尝试使用 boost::mulprecision 类型创建一个 STL(或 boost)unordered_map，例如cpp_int 但 gcc 在尝试将元素插入此容器后抛出错误。 #incl

首页

博学

6Ren·AI

商城

c++ - std::unordered_map 的哈希值

响应

碰撞

迭代顺序

一个可能的解决方案