- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
我遇到了一个很好的问题,它很相似,但完全不一样,因为它谈到了 Java,它具有不同的哈希表实现,凭借同步的访问器/mutators: What are the differences between a HashMap and a Hashtable in Java?
那么set
和unordered_set
的C++实现有什么区别呢?这个问题当然可以扩展到 map
vs unordered_map
等等其他 C++ 容器。
这是我的初步评估:
set
:虽然标准没有明确要求将其实现为树,但时间复杂性约束要求其查找/插入操作,这意味着它将始终以树的形式实现.通常作为 RB 树(如 GCC 4.8 中所见),它是高度平衡的。由于它们是高度平衡的,因此它们对于 find()
优点:紧凑(与其他 DS 相比)
Con:访问时间复杂度为 O(lg n)
unordered_set
:虽然标准没有明确要求将其实现为树,但时间复杂性约束要求其查找/插入操作,这意味着它将始终作为哈希实现-表。
优点:
缺点:
注意:哈希表的 O(1) 来自没有冲突的假设。即使负载因子为 0.5,每第二个变量插入都会导致碰撞。可以观察到,哈希表的负载因子与访问其中元素所需的操作数成反比。我们减少了更多#operations,更稀疏的哈希表。当存储的元素的大小与指针相当时,开销是相当大的。
我是否错过了应该知道的用于性能分析的 map /集之间的任何区别?
最佳答案
我想你通常已经回答了你自己的问题,但是,这个:
Not as compact as tree. (for practical purposes load factors is never 1)
不一定是真的。类型为 T
的树的每个节点(我们假设它是红黑树)使用的空间至少等于 2 * pointer_size + sizeof(T) + sizeof(bool)
.这可能是 3 * pointer size
取决于树是否包含 parent
每个树节点的指针。
将此与 HashMap 进行比较:每个 HashMap 都会浪费数组空间,因为 load factor < 1
正如你所说。然而,假设 HashMap 使用单链表进行链接(实际上,没有真正的理由不这样做),插入的每个元素只需要 sizeof(T) + pointer size
.
请注意,此分析忽略了可能来自对齐使用的额外空间的任何开销。
对于任何元素 T
它具有小尺寸(因此,任何基本类型),指针的大小和其他开销占主导地位。负载系数为 > 0.5
(例如)std::unordered_set
确实可能比等效的 std::set
消耗更少的内存.
另一个重要的缺失点是迭代 std::set
保证根据给定的比较函数生成从最小到最大的排序,同时遍历 std::unordered_set
将以“随机”顺序返回值。
关于c++ - C++ 中的 set 和 unordered_set 有什么区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16075890/
我想创建一个容器来存储唯一的整数集。 我想创建类似的东西 std::unordered_set> 但是 g++ 不允许我这样做并说: invalid use of incomplete type 's
我是 C++ 的新手,被要求将 Java 程序转换为 C++。我正在尝试编写一种方法来检查一个 unordered_set 中的所有元素是否存在于另一个 unordered_set 中。我发现下面的示
我想为我正在编写的类创建一个散列函数,我想让散列函数成为类的 friend ,这样我就不必编写不必要的 getter 方法。为此,我遵循了 this SO post 中接受的答案.但我希望能够将对象插
我想使用 std::pmr::unordered_map与 std::pmr::monotonic_buffer_resource .两者配合得很好,因为集合的节点是稳定的,所以我不会通过重新分配在缓
我有一个每帧创建的项目列表,需要对其进行排序。每个 Item 的第一个排序依据的成员变量是 unordered_set。 我已将其移动到系统中各处的有序集合中,以便我可以在项目列表中对其进行排序。但是
是否有将 std::unordered_set 与实现 operator== 和 hash 的类一起使用的捷径?具体来说,有没有一种方法可以 (1) 避免创建独立的 operator==(const
我正在将 C 文件转换为 C++。由于这些函数仍会从 C 代码中调用,因此我会将整个文件放在 extern "C" block 中。该文件包含以下代码- struct node{ char*
我有一个关于在 unordered_set 中插入的问题。我想建立一个最坏情况插入的例子。我有 30000 个字符串(len string my_set; 关于c++ - Unordered_set
我已经从 C 转向 C++,并且最近学习了 STL。 最后一行在 STL 样式中给出了很长的错误(无助)或者也许我是模板的新手,这就是为什么我觉得它无能为力。 int insert(Forest *f
我正在使用 unordered_set 来实现哈希表。我不知道如何使用查找功能。运行此代码时,我不断遇到段错误。我知道这是因为 find() 没有找到元素,但它应该找到。我的问题是如何通过我提供的自定
这个问题在这里已经有了答案: C++11 initializer list fails - but only on lists of length 2 (2 个答案) 关闭 8 年前。 当我使用包含
这个问题在这里已经有了答案: Subtracting map iterators (2 个答案) 关闭 5 年前。 尝试在无序集中查找元素的索引。发现迭代器的减法(运算符“-”)是一种方法。 vec
我注意到当我使用无序集时 unordered_set theSet;为了保存大量整数,即使调用 clear() 或 rehash(0),它也不会释放内存。即使我在函数中本地定义了集合,并且函数完成执行
谁能解释一下无序集是如何工作的?我也不确定一套是如何工作的。我的主要问题是它的查找功能的效率如何。 例如,这个大 O 的总运行时间是多少? vector theFirst; vecto
我一直在阅读 cplusplus.com 网站并尝试确保我的 unordered_set 号码不会以任何方式被修改。该站点表示容器的元素未排序,普通 set 就是这种情况。 该网站还说: Intern
我有: std::unordered_set _buttons; std::unordered_set _sprites; std::unordered_set _someOtherSprites;
缩小范围:我目前正在使用 Boost.Unordered .我看到两种可能的解决方案: 定义我自己的Equality Predicates and Hash Functions并利用模板(可能是 is
我有一个类需要一个 std::unordered_set它持有不可复制、不可移动的实体对象,并且其哈希函数对实例的地址进行哈希处理。类似于以下内容: class A { public: A()
我正在尝试散列一个 Edge 结构,以便我可以拥有一个具有唯一边的 unordered_set。在我的例子中,如果一条边的两个端点的组合在之前的集合中没有遇到,则该边被认为是唯一的。 虽然我的代码适用
我已经成功地为自定义类创建了一个散列函数(和 == 覆盖),因此我可以在 unordered_set 中使用它。但是,理想情况下,我想在要使用的类附近为我的类定义模板特化。这可以通过以下方式完成,效果
我是一名优秀的程序员,十分优秀!