- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试用 C++ 实现配对堆,我从这里获取: http://home.fnal.gov/~stoughto/build/graphviz-2.22.2/lib/vpsc/pairingheap/PairingHeap.h http://home.fnal.gov/~stoughto/build/graphviz-2.22.2/lib/vpsc/pairingheap/PairingHeap.cpp
我已经将 PairingHeap 与 std::priority_queue 进行了比较这些是结果:
gcc 4.7 -O3,核心 i7 2.4Ghzrdstc 测量周期的指令
-------------------------------------------------------------------------------
for 100.000 elements:
o std::priority_queue<int>
- insert: 9,800,415 cycles
- extract: 29,712,818 cycles
- total: 39,513,233 cycles [0.031secs]
o PairingHeap<int>
- insert: 34,381,467 cycles
- extract: 259,986,113 cycles
- total: 294,367,580 cycles [0.125secs]
-------------------------------------------------------------------------------
for 1.000.000 elements:
o std::priority_queue<int>
- insert: 95,954,533 cycles
- extract: 518,546,747 cycles
- total: 614,501,280 cycles [0.296secs]
o PairingHeap<int>
- insert: 344,453,782 cycles
- extract: 3,856,344,199 cycles
- total: 4,200,797,981 cycles [1.593secs]
-------------------------------------------------------------------------------
for 10.000.000 elements:
o std::priority_queue<int>
- insert: 999,836,450 cycles
- extract: 10,634,407,049 cycles
- total: 11,634,243,499 cycles [4.390secs]
o PairingHeap<int>
- insert: 3,441,903,781 cycles
- extract: 61,166,421,272 cycles
- total: 64,608,325,053 cycles [24.187secs]
配对堆应该比 std::priority_queue 更快,因为它应该渐进地更快操作,但此处配对堆的速度非常较慢。我认为这是因为 std::priority_queue 在底层使用了一个 vector ,而这远不止于此缓存友好,而不是像配对堆那样为每个整数分配节点。
所以,我的问题是:渐近更好的数据结构(在很大程度上)会被更差的数据结构打败吗?仅仅因为它们对缓存更友好?在更复杂的数据结构(例如配对堆)上花费大量时间真的值得吗?默认的 std::priority_queue 在很大程度上可以比它更快?
我只是没有考虑到我使用的配对堆的实现只是废话,但似乎不是,因为我尝试过的其他实现更糟糕!想法?
最佳答案
So, my question is: can asymptotically better data structures be (largely) beaten by worse ones, just because they're much more cache-friendly?
是的,这种情况一直都在发生。除了缓存友好性之外,还有其他原因(常数因素)。与同一个词的其他用法一样,asymptotic 这里指的是趋于无穷 的事物(通常是问题规模)。 A 渐近优于 B 只是说它最终会更好,而不是说它会更好(甚至等于)某个给定值。请注意,对于较大的数据集,该比率确实有所改善,但还不够。
请注意,即使是二进制堆对于较大的数据集(例如您的数据集)也不太适合缓存。一个节点的子节点和父节点很可能在一个完全不同的页面上,所以你只能从最后几级的缓存中得到一些东西(或者如果你访问的元素恰好具有相似的路径,但这几乎是给定的)任何数据结构)。有一个名为 B-heap 的变体对此进行了改进,但我无法找到更多关于它的细节(只有两个实现和关于 RAM 计算模型如何误导的咆哮)。
您必须进行概要分析才能确定,但重复分配和取消分配可能会花费大量时间。池分配器(boost,或在 std::vector 之上的手动分配器——允许用整数替换指针,这可能会节省一些空间)可以大大降低此成本。该实现似乎还为子列表使用了一个链表,这可能对缓存造成更大的伤害。数组需要一些额外的拷贝,但在实践中可能会有所改进。
Is it really worth spending much time in a more complex data structure such as a Pairing heap, when a default std::priority_queue can largely be faster than it?
足够大的数据集加上一些优化(例如专门的分配器和巧妙的节点布局)可能会使天平向有利于它的方向倾斜。无论如何,这个说法有点弄巧成拙:如果对于预期的用例,配对堆比二进制堆更快,那么标准库很可能会使用配对堆!
此外,至少在纯函数式语言中,配对堆实现起来非常简单(尽管效率不高)。这对您和 C++ 可能没什么用处,但它对“更复杂”的部分提出了挑战。
关于c++ - 配对堆与 std::priority_queue,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17468938/
我有一个服务器程序(适用于所有三个主要操作系统),它是用 C++ 创建的,它努力连接两个陌生人进行通信。我当前的模型似乎已经过时了,我只是想知道是否有更好的方法来为客户提供服务。 -服务器收到连接请求
我希望有人能告诉我 GoogleTV 如何与本地 Youtube 应用配对。 我感兴趣的是“第一屏”GoogleTV/SmartTV 功能。 据我目前所知,“第二屏”应用程序需要使用与配对服务(来自
感谢下面的提示 • 您需要一次遍历字符串一个字符(for 循环或 while 循环) 当您点击 ,这是您的结束标记 • 现在检查> 之前的字符。是/吗? • 是:查看堆栈顶部。该字符串与 之间的字符
我正在使用 Node.js 和 WebSocket 创建基本的一对一聊天。每次客户端连接时,都会向他们发送其 ID 以及 salt+id 的 MD5 哈希值。然后,他们需要与另一个客户配对。当它们配对
我刚刚开始深入研究 Racket 宏,并尝试制作一个简洁的宏定义宏。我想扩展这样的表达式: (macro id (param) replacement1 (params ...) re
我有一个 foreach 循环(看,它在下面),我得到了一些元素。将此数据存储到 MySQL 中时,我想选择每个“count[]”所属的类别(此处标记为“interaction[]”)。例如,如果第
是否有可能找到一种更好的/模块化的方式来为配对分配相同的颜色,而不是像我目前实现的那样对它们进行硬编码? 如果对象 fname 匹配,则分配相同的颜色。 以下是 javascript 对象的子集。 d
在我的 iPhone 应用程序中,我想与固件设备通信。在连接期间,他们可以要求提供配对 key ,但他们说他们没有提供输入 key 的规定。 在这种情况下,USP(用户智能手机)永远不知道输入的 ke
这个问题在这里已经有了答案: How to merge every two lines into one from the command line? (21 个回答) 关闭 6 年前。 使用一个简
function pair(str) { var dna = []; var dnaarr = []; for(var i = 0; i < str.length; i++) {
我是一个相对年轻的开发人员,我对一些事情感到困惑。 这是我的代码: function pairElement(str) { var arr = []; var pairs = [
我有一个脚本,可以从文本文件中读取并插入元素,以便可以对它们进行样式设置和显示。但是,我现在想在 DIV 中配对两个元素。这是代码: var lines = request.responseText.
.Spotify:hover img { display:block; position: absolute; z-index: 0; top:17%; lef
我正在努力使用摩托罗拉随 RAZR 提供的 BT 4.0 API。在 one of their documents它声明在连接和使用他们的框架之前使用 Android API 进行配对。根据他们的说明
谁能告诉我一次可以通过蓝牙将多少台设备与 iPhone 配对..需要帮助..直到现在我还没有确切的数字。 最佳答案 在 iOS 6.1.4 中,低功耗蓝牙设备的当前限制是 10 个同时连接(至少在 N
我正在创建一个扩展推送通知的 Android Wear 应用程序。当推送通知进来时,我的应用程序会从服务器下载大约 10 张图像,并在 watch 上显示这些额外的图像。这些图像特定于 android
关闭。这个问题需要details or clarity .它目前不接受答案。 想改进这个问题?通过 editing this post 添加详细信息并澄清问题. 8年前关闭。 Improve this
我有一个类似于使用以下命令获得的数据表: dt <- data.table( time = 1:8, part = rep(c(1, 1, 2, 2), 2), type = rep(c(
为了回应有用的评论,我编辑了原始问题(我假设 for 循环和应用循环给出不同的结果)。 我正在使用 R 运行大量 2 组 t 检验,使用来自分隔表的输入。根据此处和其他地方的建议,我尝试了“for-l
是否可以将脚本(例如 MathJax)加载到 EpicEditor 预览 iFrame 中?我希望我的预览是正确的 Markdown,然后运行 javascript 来预览 MathJax 内容。
我是一名优秀的程序员,十分优秀!