- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我遇到了 std::set 的一个奇怪行为。
代码如下:
#include <cstdio>
#include <windows.h>
#include <stdlib.h>
#include <vector>
#include <set>
using namespace std;
int main(int argc, char *argv[])
{
set<int> b[100];
for (int o=0; o<10; o++)
{
int tt = GetTickCount();
for (int i=0; i<5000000; i++)
{
b[o].insert(i);
}
tt = GetTickCount() - tt;
b[o].clear();
printf("%d\n", tt);
}
return 0;
}
我在 Windows XP 上运行。
这是有趣的部分:第一次打印时间约为 3500 毫秒,而接下来的打印时间都超过 9000 毫秒!为什么会这样?
哦,这只发生在发布版本上(-O2 优化)。
它不会发生在 Linux 上(在更改代码以在那里编译之后)。
还有一件事:当我在使用 Intel VTune 进行分析时运行它时,它总是需要大约 3000 毫秒,所以它应该是这样的。
更新:这是一些新代码:
#include <cstdio>
#include <windows.h>
#include <stdlib.h>
int main(int argc, char *argv[])
{
const int count = 10000000;
int **a = new int*[count];
for (int o=0; o<10; o++)
{
int ttt = GetTickCount();
for (int i=0; i<count; i++)
{
a[i] = new int;
*a[i] = i;
}
int ttt2 = GetTickCount();
for (int i=0; i<count; i++)
{
int r1 = rand() * 10000 + rand();
int r2 = rand() * 10000 + rand();
r1 = r1%count;
r2 = r2%count;
int *e = a[r1];
a[r1] = a[r2];
a[r2] = e;
}
int ttt3 = GetTickCount();
for (int i=0; i<count; i++)
{
delete a[i];
}
int ttt4 = GetTickCount();
printf("%d %d\n", ttt2-ttt, ttt4-ttt3);
}
return 0;
}
这是同样的问题。发生的事情是我分配了许多小对象,然后以随机顺序删除它们——所以它类似于它在 std::set 中的样子。所以这是 Windows 内存管理问题。它不能很好地处理许多小的分配和删除。
最佳答案
我无法准确解释为什么会这样,但我可以提出一个解决方案。当我在调试器下运行发布版本时(使用 F5
),我已经能够在我的 PC 上重现这个。当我从命令行或使用 Ctrl-F5
运行构建时,我没有得到那种行为。
这与在调试器下启动时默认打开的调试堆有关。描述的很详细here .为了防止这种情况发生
Ctrl-F5
(调试 -> 不调试开始)运行。_NO_DEBUG_HEAP=1
。如果非要我猜的话,我会说它与 Windows/VS 运行时中内存分配跟踪的实现有关。可能一些内部列表已填满并重新分配或按照这些思路进行其他操作。
关于c++ - std::set fast and slow,这是怎么回事?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8151099/
我有一个 mysql 数据库,用户可以在其中输入文本。然后他们需要能够搜索此文本。我刚刚实现了 mysql 全文搜索,它确实使搜索速度快了很多。 然而,毫不奇怪,它使插入变慢了。但令我惊讶的是速度慢了
我在 Linux 3.15 机器上写了一个 TCP 客户端,它能够使用 TCP Fast Open: status = sendto(sd, (const void *) data,
“free(): invalid next size (fast)”中的“fast”或“normal”是什么意思:谁能解释一下这是什么意思/暗示或在哪里可以找到答案? 最佳答案 您看到的错误消息表明在
像 FAST 这样的数据编码协议(protocol)非常巧妙地减少了需要发送的数据量。本质上,一个人得到一个 char*,读取前几个字节作为整数会给你一个 ID 号,它指向你如何解码其余字节的说明(即
语境 我非常喜欢Roy Osherove所说的“快速集成测试”。这是集成测试,它可以: 严格在您的开发箱上执行。无需单独的环境。 尽管正在进行集成测试,但此类测试通常是通过您的单元测试工具(NUnit
我的代码中有一些子例程,我需要测量它们的执行时间。让我们假设例程在极端情况下每秒被调用 10-100 次。在 Fortran 中有许多方法可以测量时间,但由于调用的频率,我需要一种开销最低的方法。 时
我的电脑中的这段代码在java中执行了1秒,但在C中执行了20多秒。java是如何执行的? int a[] = new int[50000] ; for(int i = 0 ; i < 50000 ;
我用 fastai.tabular 训练了一个模型。现在,我有一个合适的学习器。最终,模型将应用于新数据,而不仅仅是在训练集上拟合并在测试集上进行评估等。我尝试了不同的方法,所有这些都导致了错误或一些
当我曾经对嵌入式系统和早期 8/16 位 PC(6502、68K、8086)进行编程时,我对每条指令执行所需的确切时间(以纳秒或微秒为单位)有很好的把握。根据系列的不同,一个(或四个)周期相当于一次“
让我立即澄清一下这个听起来很温和的标题。这实际上已经困扰我很长一段时间了,尽管感觉这是一个非常基本的问题。 许多语言让开发人员玩弄位,从而给人一种效率错误的印象,例如 bool.h据我了解,C hea
我有一个代码。 private static String generateString(int size) { StringBuffer s = new StringBuffer();
[简短回答:糟糕的基准测试方法。你会认为我现在已经想通了。] 问题表现为“找到一种快速计算 x^y 的方法,其中 x 和 y 是正整数”。典型的“快速”算法如下所示: public long fast
我必须乘以 2(大部分时间)稀疏矩阵。这些矩阵相当小(大约 10k*10k),我有两个至强四核和一个线程来完成这项工作? 是否有任何用于多线程 moltiplication 的快速库?还有其他建议吗?
我正在对约 40K 文档的集合执行 where in box 查询。查询耗时约 0.3 秒,获取文档耗时约 0.6 秒(结果集中约有 10K 文档)。 文档相当小(每个约 100 字节),我限制结果只
我正在寻找 4 个变量的标量函数的局部最小值,并且我对变量有范围约束(“框约束”)。函数导数没有封闭形式,因此需要解析导数函数的方法是不可能的。我已经用 optim 尝试了几个选项和控制参数功能,但所
我正在尝试部署一个使用 CGI::Application 的 Perl 应用程序通过 Nginx,它们之间使用 FastCGI 进行通信。 Nginx 不断返回“502 Bad Gateway”,错误
我对 C++ 很陌生,所以很抱歉,如果我问一些愚蠢的问题,但我在网上找不到答案(只有一篇引用 python ( Can mmap and gzip collaborate? ) 的帖子),试图看看是否
我正在试验不同类型的 OpenCV 的 FAST 检测器。 可用的类型有: TYPE_5_8, TYPE_7_12, TYPE_9_16 最后一个是默认的,用这张照片描述: 我假设 TYPE_7_12
我正在尝试开发一个 android 应用程序,它应该分析来自相机的帧并检测角落。 我的目标是检测当前棋盘状态并向服务器提供数据。 我已经在我的应用程序中实现了 OpenCV,并且正在尝试使用 FAST
我正在使用 Tensorflow 和 faster_rcnn_inception_v2_coco 模型训练对象检测器,但在对视频进行分类时遇到了很多误报。 经过一些研究,我发现我需要在训练过程中添加负
我是一名优秀的程序员,十分优秀!