- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我想比较两个整数搜索树(AVL树和RedBlack树)的性能那么,我应该如何设计/设计测试来实现这一点呢?例如,让我们考虑一下insert操作,我应该遵循哪些步骤来声明在rb情况下这个操作平均更快?我应该只插入一个元素(假设树是预先填充的)还是插入序列的时间?另外,我应该考虑什么来正确地测量CPU时间?
提前谢谢。
最佳答案
这是一个非常广泛的问题,因此,我不认为你应该希望有人能在这里,给你一个关于如何衡量绩效的最后正确答案。有人说…
首先,您应该开发一套测试。存在两种流行的技术:监视应用程序所做的实际操作序列(因此,找到一些使用AVL或RB树的开放源代码应用程序,并添加一些代码来打印它执行的操作序列),或者以分析(或综合)的方式创建这样的操作流,以针对任意数量的操作。例数(平均用法、特殊类型的异常用法或其他异常用法、随机用法等)。你测试的痕迹越多越好。
一旦你有你的跟踪集要测试,你需要开发一个驱动程序来做评估。驱动程序应该很简单,对于avl和rb树都是一样的(我认为在这种情况下,这不应该是个问题;两者都向用户提供相同的接口,只是在内部实现细节方面有所不同)。驱动程序应该能够有效地再现记录在跟踪集中的使用情况,并使跟踪操作在数据结构上执行我喜欢做的一件事是包含第三个什么都不做的“虚拟”候选;这样,我就可以看到跟踪处理对整体性能的影响有多大。
每个跟踪应该执行很多次您可以将其形式化(以将统计不确定性降低到已知范围内),但经验法则是,错误的顺序将根据1/sqrt(n)缩小,其中n是试验次数。换言之,通过运行每个跟踪10000次而不是100次,您将得到平均小10倍的错误。记录所有值;要查找的是平均值、中值、模式等。对于每次运行,请尝试保持系统条件不变;没有其他程序正在运行等。为了帮助消除由于外部因素更改而产生的虚假结果,可以剔除底部和顶部10%的异常值……
现在,只需比较数据集。也许你最关心的是追踪的平均时间?也许是最坏的也许你真正关心的是一致性;标准差是大还是小?您应该有足够的数据来比较在两个测试结构上执行的给定跟踪的结果;对于不同的跟踪,查看不同的图可能更有意义(例如,如果您创建了一个对RB树来说应该是最坏情况的合成基准,您可能会问RB树和AVL树的性能有多差然而,对于另一个表示avl树的最佳情况的跟踪,您可能并不关心这个问题,等等。)
CPU上的计时本身就是一个挑战。您需要确保计时器的分辨率足以测量事件clock()和gettimeofday()函数以及其他函数是记录事件时间的常用选择如果跟踪完成得太快,则可以获得多个测试的聚合时间(因此,如果计时器支持微秒计时,并且跟踪在10微秒内完成,则可以测量跟踪的100次执行,而不是1次执行,并获取10毫秒的时间值,这应该是准确的)。
另一个潜在的陷阱是每次都提供相同的执行环境。在两次跟踪运行之间,至少可以考虑确保从干净缓存开始的技术。要么这样,要么不计时第一次执行,要么理解在消除异常值时可能会剔除此结果。重置缓存(通过操作某个大型数组的每个元素,例如在执行跟踪之间)可能更安全,因为代码A可能会从缓存中包含某些值中获益,而代码B可能会受到影响。
以下是在进行自己的绩效评估时可能会考虑的一些事项其他工具(例如papi和其他分析器)可以测量某些事件(缓存命中/未命中、指令等),而且这些信息可以进行比简单比较挂钟运行时间更丰富的比较。
关于performance - 如何比较两个数据结构的运行时间,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7905603/
考虑以下示例代码: void main() { List array = []; for (int i = 0; i newList = array.where( (value) => v
我在java中实现了textrank,但它看起来很慢。有谁知道它的预期性能吗? 如果预计速度不会很慢,则可能是以下任一问题: 1) 似乎没有办法在 JGraphT 时间内创建一条边并同时为其添加权重,
我正在尝试提交解决方案(使用一些具有编译时间限制的在线编译器)来对数组进行排序 - 这是我的代码片段 - class TSORT { public static void main(Strin
只是一个困惑......部分C++示例代码如下 我只是重新编辑了整个帖子。抱歉造成任何混淆 int i, j; i = 0; // c1 j = 0; // c2 while (i
我正在使用 OpenMP 运行一些并行工作,但发现加速无法很好地扩展。然后我发现随着线程数量的增加,完成相同工作量的时间也会增加。这是示例: void fillingVec(vector& vec)
我目前正在分析 maximum subarray problem 用于强力算法和分而治之算法(递归)。 使用蛮力算法,最坏情况下的运行时间为 O(n^2)。使用递归算法,最坏情况下的运行时间为 O(n
如果我有两个数组都有 10000 个项目,现在我想将它们合并到一个数组中,所以我用 concat 来完成: array1=array1.concat(array2); 但是有人知道运行时间是多少吗?
{ clock_t t1, t2; double time1 = 0; t1 = clock(); bubbleSort(data, n); t2 = cloc
我在某处读到有人可以在运行时访问配置值,但不能在设计时访问。在这种情况下,运行时和设计时有什么区别? 最佳答案 设计时间是有人用愉快的“看起来不错!”在我们的 Word 文档和 UML 图表上签字的时
我正在比较我们一个项目的两个分支的性能,一个比另一个慢得多。我注意到其中一个的 GC 运行计数更高(见下图)。 更有趣的是,运行时间要长很多倍,远远超过额外运行所能解释的时间。什么可以解释运行次数增加
我想以可读的方式格式化 log4j 经过的运行时间,%r 参数: [00:36:25.844] 和 [01 13:35:25.844] [时:分:ss.SSS] ... [dd 时:分:ss.SSS]
如何计算此代码的大 O 运行时效率?我的直觉告诉我它是 O(n^3),但我不确定,因为我不确定循环是独立的还是相关的。 for (i=1; i<=n; i++) for (j=1; j<=n;
确定这些不同循环的大 O 运行时间? for i = 1 to n { ... for j = 1 to 2*i { ... k = j; while (k>=0)
运行时间、复杂性、编译时间和执行时间有什么区别? 运行时间与时间复杂度有冲突,执行时间和执行时间有什么区别? 最佳答案 您真正需要的是如何将大O时间复杂度转换为运行时。这不像一开始看起来那么容易。 因
斯内普的《Unfriendly Algorithms for Wizards》教科书声称合并的运行时间排序是 O(n^4)。这种说法是否正确? 解决方案:是的。这个说法在技术上是正确的,因为 O(n^
我有一系列问题需要反馈和答案。我会评论我的想法,这不是家庭作业而是准备为了我的考试。 我的主要问题是确定不同情况下循环的迭代。试图弄清楚这一点会如何? 评估运行时间。 Q2。 for(int i =
我试图找到一个合理的机会来测量我的 java 程序/程序部分的速度,例如测试两种方法中哪一种执行得更快。注释掉这两种方法中的一种,确定运行时间,最后比较时间。我不想在我的程序中使用任何代码,例如: p
好吧,这些都是非常简单的方法,而且有几个,所以当它们都是同一件事时,我不想只创建多个问题。 BigO 是我的弱点。我只是想不通他们是如何得出这些答案的。无论如何,您是否可以让我深入了解您对分析其中一些
如何计算此给定代码的 Theta 运行时间: void f(int n) { for (int i=3; i
使用 leiningen 创建 uberjar 并使用 java -jar foo-uberjar.jar 运行该 jar 后程序运行良好,最后一行代码执行得相当快,但程序在关闭前挂了大约一分钟。这是
我是一名优秀的程序员,十分优秀!