- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我的程序遇到了一些奇怪的行为。我有一个在执行过程中被调用很多的函数,当我在这个函数中再声明一个 double
变量时,程序运行速度慢了 10 倍。这是函数代码:
void MazeWall::goSomewhere( WallInfo &caller )
{
double slowDown = 0;
bool possibleWays[numberOfDirections];
bool BadWays[numberOfDirections];
int weightsOfDirections[numberOfDirections] = {};
int numOfPosWays = findPosWays( caller, possibleWays );
int numOfBadWays = findBadWays( caller, BadWays, possibleWays );
int selectedDir;
if ( numOfPosWays == numOfBadWays ) // if all ways are bad
{
selectedDir = randomChoice( BadWays, numberOfDirections, true ); // select a bad way
}
else
{
for ( int k = 0; k < numberOfDirections; k++ )
{
possibleWays[k] = possibleWays[k] && (!BadWays[k] ); // leave only good ways
}
int step = 32 / numberOfDirections;
// check how occupied these ways are:
for ( int l = 0; l < numberOfDirections; ++l )
{
CyclicInt directionOfSight( 0, 31, 28 );
if ( possibleWays[l] )
{
directionOfSight = directionOfSight + l*step;
int integralDistance = 0;
for ( int m = 0; m <= 8; ++m )
{
integralDistance += caller.distanceToAWall32( directionOfSight, 32 );
directionOfSight = directionOfSight + 1;
}
weightsOfDirections[l] = integralDistance;
}
}
selectedDir = weightedRandom( weightsOfDirections, numberOfDirections );
}
CyclicInt cyclicDir( 0, numberOfDirections - 1, selectedDir );
caller.step( cyclicDir ); // make 1 step in selected direction
}
在此代码中,有一个名为 slowDown
的变量会导致问题。如果我把它注释掉,程序运行得很快。如果我不将其初始化为特定值,程序也会运行得很快。但是,如果我保留这样的代码,它的运行速度将慢近 10 倍。我没有在程序的任何地方使用这个变量。
此外,我发现一旦我添加了一个 double
变量,再添加 35 个 double
不会影响性能,但添加第 36 个会导致速度再次下降,所以这不能仅仅是因为分配开销。
我总是使用相同的输入条件来测试我的程序。我使用了一个全局变量来找出这个函数被调用了多少次——对于特定的测试条件,大约 3000 次以上。
我用其他函数尝试了这个,例如,findPosWays()
和 findBadWays()
,它对某些函数有效,对其他函数无效。
我在 Windows 7 上使用 cygwin g++ 编译器。
我的问题是,为什么会发生这种情况以及如何避免这种行为。我想函数应该适合其中的一些内存块,如果它们不适合,则会导致寻找更大块的一些非常昂贵的操作。但如果是这样,难道不应该在编译期间完成,而不是在运行时完成吗?
我担心我的代码中可能有更多函数的大小“错误”并且会减慢程序速度,因此检测此类函数似乎很重要。
更新:我被要求粘贴程序的快速和慢速版本的汇编代码,所以这里是: http://pastebin.com/At0Sy0ZT - 慢版
http://pastebin.com/qdY8G7C5 - 快速版本
不知道这是否有任何帮助,即使我将 goSomewhere()
放在一个单独的文件中,汇编代码仍然很长。
最佳答案
你的错误是你没有使用优化进行编译,或者你的编译器已经过时了。任何体面的编译器都会从可执行文件中完全去除未使用的变量。
我们可以根据额外变量、更多缓存未命中等推测内存中 possibleWays
和 BadWays
的对齐方式,但重点是在没有优化的情况下进行任何分析没有任何意义。
关于c++ - 在函数中再分配一个变量会大大增加执行时间,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21812905/
我有一个应用程序,它会抛出 GKSession 并在各种条件下(连接超时、 session 失败等)创建一个新的 GKSession。不过,我遇到了内存泄漏问题,并且有时会在重新连接几次循环后崩溃。
比如我在宿主代码中有一个浮点指针 float *p 是否可以确定他指向的内存类型(设备/主机)? 最佳答案 在 UVA system 中, 运行时 API 函数 cudaPointerGetAttri
我已将项目转换为 .Net 4.0 并且以下代码不起作用: typeof(RuntimeTypeHandle).GetMethod("Allocate", BindingFlags.Instance
当我声明 char ch = 'ab' 时,ch 只包含 'b',为什么它不存储 'a'? #include int main() { char ch = 'ab'; printf("%c"
我对 Disk Sector 和 Block 有疑问。扇区是一个单位,通常为 512 字节或 1k、2k、4k 等取决于硬件。文件系统 block 大小是一组扇区大小。 假设我正在存储一个 5KB 的
假设我有 8 个人和5000 个苹果。 我想将所有苹果分发给所有 8 个人,这样我就没有苹果了。 但每个人都应该得到不同数量 将它们全部分发出去的最佳方式是什么? 我是这样开始的: let peopl
我正在构建的网站顶部有一个搜索栏。与 Trello 或 Gmail 类似,我希望当用户按下“/”键时,他们的焦点就会转到该搜索框。 我的 JavaScript 看起来像这样: document.onk
我有一小段代码: if (PZ_APP.dom.isAnyDomElement($textInputs)){ $textInputs.on("focus", function(){
我观察到以下行为。 接受了两个属性变量。 @property (nonatomic, retain) NSString *stringOne; @property (nonatomic, assign
我正在解决这样的问题 - 实现一个计算由以下内容组成的表达式的函数以下操作数:“(”、“)”、“+”、“-”、“*”、“/”。中的每个数字表达式可能很大(与由字符串表示的一样大)1000 位)。 “/
我有一组主机和一组任务。 每个主机都有 cpu、mem 和任务容量,每个任务都有 cpu、mem 要求。 每个主机都属于一个延迟类别,并且可以与具有特定延迟值的其他主机通信。 每个任务可能需要以等于或
该程序的作用:从文件中读取一个包含 nrRows 行和 nrColomns 列的矩阵(二维数组)。矩阵的所有元素都是 [0,100) 之间的整数。程序必须重新排列矩阵内的所有元素,使每个元素等于其所在
世界!我有个问题。今天我尝试创建一个代码,它可以找到加泰罗尼亚语号码。但是在我的程序中可以是长数字。我找到了分子和分母。但我不能分割长数字!此外,只有标准库必须在此程序中使用。请帮帮我。这是我的代码
我确定我遗漏了一些明显的东西,但我想在 Objective C 中创建一个 NSInteger 指针的实例。 -(NSInteger*) getIntegerPointer{ NSInteger
这个问题在这里已经有了答案: Difference between self.ivar and ivar? (4 个答案) 关闭 9 年前。
我如何将 v[i] 分配给一系列整数(v 的类型是 vector )而无需最初填充 最佳答案 你的意思是将 std::vector 初始化为一系列整数? int i[] = {1, 2, 3, 4,
我想寻求分配方面的帮助....我把这个作业带到了学校......我必须编写程序来加载一个 G 矩阵和第二个 G 矩阵,并搜索第二个 G 矩阵以获取存在数第一个 G 矩阵的......但是,当我尝试运行
我必须管理资源。它基本上是一个唯一的编号,用于标识交换机中的第 2 层连接。可以有 16k 个这样的连接,因此每次用户希望配置连接时,他/她都需要分配一个唯一索引。同样,当用户希望删除连接时,资源(号
是否有任何通用的命名约定来区分已分配和未分配的字符串?我正在寻找的是希望类似于 us/s 来自 Making Wrong Code Look Wrong ,但我宁愿使用常见的东西也不愿自己动手。 最佳
我需要读取一个 .txt 文件并将文件中的每个单词分配到一个结构中,该结构从结构 vector 指向。我将在下面更好地解释。 感谢您的帮助。 我的程序只分配文件的第一个字... 我知道问题出在函数 i
我是一名优秀的程序员,十分优秀!