- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我们有大型(超过 100,000 个元素)有序结构 vector (运算符 < 重载以提供排序):
std::vector < MyType > vectorMyTypes;
std::sort(vectorMyType.begin(), vectorMyType.end());
我的问题是,在向这些 vector 添加新元素同时保留排序顺序时,我们遇到了性能问题。目前我们正在做类似的事情:
for ( a very large set )
{
vectorMyTypes.push_back(newType);
std::sort(vectorMyType.begin(), vectorMyType.end());
...
ValidateStuff(vectorMyType); // this method expects the vector to be ordered
}
这不是完全我们的代码的样子,因为我知道这个例子可以用不同的方式优化,但是它让你知道性能可能是一个问题,因为我正在排序在每次 push_back
之后。
我想我基本上有两种选择来 boost 性能:
使用(手工制作的?)插入排序而不是 std::sort
来 boost 排序性能(对部分排序的 vector 进行插入排序是盲目的快)
使用std::make_heap
和std::push_heap
创建堆以维护排序顺序
我的问题是:
我应该实现插入排序吗? Boost 中有什么可以帮助我的吗?
我应该考虑使用堆吗?我该怎么做?
编辑:
感谢您的所有回复。我知道我给出的例子远非最佳,它不能完全代表我现在代码中的内容。它只是为了说明我遇到的性能瓶颈——也许这就是为什么这个问题没有得到很多赞成票的原因:)
非常感谢你Steve ,通常是最简单的答案是最好的,也许是我对问题的过度分析使我对最明显的解决方案视而不见。我确实喜欢您概述的直接插入到预定 vector 中的巧妙方法。
正如我所说,我现在只能使用 vector ,所以 std::set、std::map 等不是一个选项。
最佳答案
有序插入不需要 boost :
vectorMyTypes.insert(
std::upper_bound(vectorMyTypes.begin(), vectorMyTypes.end(), newType),
newType);
upper_bound
提供了一个有效的插入点,前提是 vector 已排序,因此只要您只在正确的位置插入元素,您就完成了。我最初说的是 lower_bound
,但是如果 vector 包含多个相等的元素,则 upper_bound
选择需要较少工作的插入点。
这确实要复制O(n)个元素,但你说插入排序“快得要命”,这个更快。如果不够快,你必须找到一种方法来批量添加项目并在最后验证,或者放弃连续存储并切换到维护顺序的容器,例如 set
或多集
。
堆不维护底层容器中的顺序,但适用于优先级队列或类似队列,因为它可以快速移除最大元素。你说你想按顺序维护 vector ,但如果你实际上从未按顺序迭代整个集合,那么你可能不需要它完全排序,这就是堆有用的时候。
关于c++ - 应该使用插入排序还是构造堆来 boost 性能?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1171365/
谁能解释一下原因: (define a (lambda() (cons a #f))) (car (a)) ==> procedure ((car (a))) ==> (procedure . #f)
这是 PyBrain 网站的摘录。我了解大部分正在发生的事情,但是一行让我完全难住了。我以前从未在 python 代码中看到过这样的东西。这是整个循环,对于上下文: for c in [0,
我是gradle / groovy的新手。我想创建将做一些事情的自定义任务。我的第一个问题是任务完成时该如何做?我可以覆盖doFirst / doLast闭包吗?也许我可以重写某些在开始和结束时都会执
我刚刚开始评估 MS 企业库。他们使用以下指令来获取实例: var customerDb = EnterpriseLibraryContainer.Current.GetInstance("C
这是我的 if else Ansible 逻辑.. - name: Check certs exist stat: path=/etc/letsencrypt/live/{{ rootDomain
我正在使用construct 2.8 对一些失传已久的 Pascal 程序创建的一些文件的 header 进行逆向工程。 header 由许多不同的记录组成,其中一些是可选的,我不确定顺序是否固定。
我在将 getchar() 的输入放入 char *arr[] 数组时遇到问题。我这样做的原因是因为输入数据(将是一个带有命令行参数的文件)将存储在一个 char 指针数组中以传递给 execvp 函
通常我们不能约束类型参数 T派生自密封类型(例如 struct 类型)。这将毫无意义,因为只有一种类型适合,因此不需要泛型。所以约束如下: where T : string 或: where T :
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 9 年前。 Improve th
#include using namespace std; class A { private: int m_i; friend int main(int argc, char cons
这个问题在这里已经有了答案: Are there legitimate uses for JavaScript's "with" statement? (33 个答案) 关闭 9 年前。 我有这个代
在this answer我看到了下一个 Bash 结构。 yes "$(< file.txt)" 什么意思 "$(< file.txt)" ? 我明白了 命令替换 - $(command)用命令的结
if (a == 1) //do something else if (a == 2) //do something else if (a == 3) //do somethi
关于构造的快速简单的问题。 我有以下用于将项目添加到 ListView 的代码。 ListViewItem item = new ListViewItem(); item.Text = file; i
我想使用 std::vector 来控制给定的内存。首先,我很确定这不是好的做法,但好奇心占了上风,无论如何我都想知道如何做到这一点。 我遇到的问题是这样的方法: vector getRow(unsi
下面显示了一段简单的javascript: var mystring = ("random","ignored","text","h") + ("ello world") 这个字符串会生成 hello
在 Java 中,创建对象的标准方法是使用 MyClass name = new MyClass(); 我也经常看到构造 new MyClass() { /*stuff goes in here*/
我正在编写 C++ ndarray 类。我需要动态大小和编译时大小已知的数组(分别分配自由存储和分配堆栈)。我想支持从嵌套的 std::initializer_list 进行初始化。 动态大小的没问题
我正在将一个项目从 Visual Studio 2005 转换为 Visual Studio 2008,并提出了上述结构。 using Castle.Core.Resource; using Cast
我想知道我在这里的想法是否正确,我主要针对接口(interface)进行编程,所以我想知道下面的类是否应该通过 DI 注入(inject),或者我应该自己实例化一个类... 注意:这些服务保存在我的核
我是一名优秀的程序员,十分优秀!