- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我正在尝试编写这样的方法:
static boolean fitsInDouble(long x) {
// return true if x can be represented
// as a numerically-equivalent double
}
我正在努力寻找最有效的实现方式。我选择了一个,但后来一位同事运行了基准测试并得到了不同的相对结果。对我来说最快的实现对他来说并不是最快的。
这些基准有什么问题吗?
package rnd;
import org.openjdk.jmh.annotations.Benchmark;
import org.openjdk.jmh.annotations.BenchmarkMode;
import org.openjdk.jmh.annotations.Fork;
import org.openjdk.jmh.annotations.Measurement;
import org.openjdk.jmh.annotations.Mode;
import org.openjdk.jmh.annotations.OutputTimeUnit;
import org.openjdk.jmh.annotations.Scope;
import org.openjdk.jmh.annotations.State;
import org.openjdk.jmh.annotations.Warmup;
import org.openjdk.jmh.infra.Blackhole;
import org.openjdk.jmh.runner.Runner;
import org.openjdk.jmh.runner.options.Options;
import org.openjdk.jmh.runner.options.OptionsBuilder;
import java.math.BigDecimal;
import java.util.concurrent.TimeUnit;
@State(Scope.Thread)
@BenchmarkMode(Mode.AverageTime)
@OutputTimeUnit(TimeUnit.NANOSECONDS)
@Fork(1)
@Measurement(iterations = 5)
@Warmup(iterations = 5)
public class Benchmarks {
public static void main(String[] args) throws Exception {
Options options = new OptionsBuilder()
.include(Benchmarks.class.getName())
.build();
new Runner(options).run();
}
@Benchmark
public void bigDecimal(Blackhole bh) {
for (long x : NUMBERS) bh.consume(bigDecimal(x));
}
@Benchmark
public void cast(Blackhole bh) {
for (long x : NUMBERS) bh.consume(cast(x));
}
@Benchmark
public void zeros(Blackhole bh) {
for (long x : NUMBERS) bh.consume(zeros(x));
}
public static boolean bigDecimal(long x) {
BigDecimal a = new BigDecimal(x);
BigDecimal b = new BigDecimal((double) x);
return a.compareTo(b) == 0;
}
public static boolean cast(long x) {
return x == (long) (double) x
&& x != Long.MAX_VALUE;
}
public static boolean zeros(long x) {
long a = Math.abs(x);
int z = Long.numberOfLeadingZeros(a);
return z > 10 || Long.numberOfTrailingZeros(a) > 10 - z;
}
private static final long[] NUMBERS = {
0,
1, 2, 3, 4, 5, 6, 7, 8, 9, 10,
-1, -2, -3, -4, -5, -6, -7, -8, -9, -10,
123, 456, 789,
-123, -456, -789,
101112, 131415, 161718,
-101112, -131415, -161718,
11L,
222L,
3333L,
44444L,
555555L,
6666666L,
77777777L,
888888888L,
9999999999L,
1111L,
22222L,
333333L,
4444444L,
55555555L,
666666666L,
7777777777L,
88888888888L,
999999999999L,
11111111,
222222222,
3333333333L,
44444444444L,
555555555555L,
6666666666666L,
77777777777777L,
888888888888888L,
9999999999999999L,
Long.MAX_VALUE,
Long.MAX_VALUE - 1,
Long.MIN_VALUE,
Long.MIN_VALUE + 1,
(1L << 53),
(1l << 53) + 1,
(1l << 53) + 2,
(1l << 60),
(1l << 60) + 1,
(1l << 60) + 8,
(1l << 60) + 32,
(1l << 60) + 64,
(1l << 60) + 128,
(1l << 60) + 256,
(-1L << 53),
(-1L << 53) - 1,
(-1L << 53) - 2,
(-1l << 60),
(-1l << 60) - 1,
(-1l << 60) - 8,
(-1l << 60) - 32,
(-1l << 60) - 64,
(-1l << 60) - 128,
(-1l << 60) - 256
};
}
我们的环境存在细微差别。
我:Windows 10,JDK 1.8.0_45,“zeros”是最快的
他:Windows 7,JDK 1.8.0_20,“投”最快
无论是在 IDE 中还是在命令行中运行,我们的结果在每次运行中都是自洽的。我们使用的是 JMH 1.10.5。
这里发生了什么?基准测试似乎不可信,我不知道如何修复它。
最佳答案
即使在具有相同环境的同一台机器上,我也可以重现不同的结果:有时 cast
稍微快一些,有时 zeros
是。
# JMH 1.10.5 (released 9 days ago)
# VM invoker: C:\Program Files\Java\jdk1.8.0_40\jre\bin\java.exe
# VM options: -Didea.launcher.port=7540 -Didea.launcher.bin.path=C:\Program Files (x86)\IDEA 14.1.3\bin -Dfile.encoding=UTF-8
# Warmup: 3 iterations, 1 s each
# Measurement: 5 iterations, 1 s each
# Timeout: 10 min per iteration
# Threads: 1 thread, will synchronize iterations
# Benchmark mode: Average time, time/op
# Benchmark: bench.LongDouble.cast
# Run progress: 0,00% complete, ETA 00:01:20
# Fork: 1 of 5
# Warmup Iteration 1: 513,793 ns/op
# Warmup Iteration 2: 416,508 ns/op
# Warmup Iteration 3: 402,110 ns/op
Iteration 1: 402,535 ns/op
Iteration 2: 403,999 ns/op
Iteration 3: 404,871 ns/op
Iteration 4: 404,845 ns/op
Iteration 5: 401,705 ns/op
# Run progress: 10,00% complete, ETA 00:01:16
# Fork: 2 of 5
# Warmup Iteration 1: 421,552 ns/op
# Warmup Iteration 2: 418,925 ns/op
# Warmup Iteration 3: 421,813 ns/op
Iteration 1: 420,978 ns/op
Iteration 2: 422,940 ns/op
Iteration 3: 422,009 ns/op
Iteration 4: 423,011 ns/op
Iteration 5: 422,406 ns/op
# Run progress: 20,00% complete, ETA 00:01:07
# Fork: 3 of 5
# Warmup Iteration 1: 414,057 ns/op
# Warmup Iteration 2: 410,364 ns/op
# Warmup Iteration 3: 402,330 ns/op
Iteration 1: 402,776 ns/op
Iteration 2: 404,764 ns/op
Iteration 3: 400,346 ns/op
Iteration 4: 403,227 ns/op
Iteration 5: 403,350 ns/op
# Run progress: 30,00% complete, ETA 00:00:58
# Fork: 4 of 5
# Warmup Iteration 1: 422,161 ns/op
# Warmup Iteration 2: 419,118 ns/op
# Warmup Iteration 3: 402,990 ns/op
Iteration 1: 401,592 ns/op
Iteration 2: 402,999 ns/op
Iteration 3: 403,035 ns/op
Iteration 4: 402,625 ns/op
Iteration 5: 403,396 ns/op
# Run progress: 40,00% complete, ETA 00:00:50
# Fork: 5 of 5
# Warmup Iteration 1: 422,621 ns/op
# Warmup Iteration 2: 419,596 ns/op
# Warmup Iteration 3: 403,047 ns/op
Iteration 1: 403,438 ns/op
Iteration 2: 405,066 ns/op
Iteration 3: 403,271 ns/op
Iteration 4: 403,021 ns/op
Iteration 5: 402,162 ns/op
Result "cast":
406,975 ?(99.9%) 5,906 ns/op [Average]
(min, avg, max) = (400,346, 406,975, 423,011), stdev = 7,884
CI (99.9%): [401,069, 412,881] (assumes normal distribution)
# JMH 1.9.3 (released 114 days ago, please consider updating!)
# VM invoker: C:\Program Files\Java\jdk1.8.0_40\jre\bin\java.exe
# VM options: -Didea.launcher.port=7540 -Didea.launcher.bin.path=C:\Program Files (x86)\IDEA 14.1.3\bin -Dfile.encoding=UTF-8
# Warmup: 3 iterations, 1 s each
# Measurement: 5 iterations, 1 s each
# Timeout: 10 min per iteration
# Threads: 1 thread, will synchronize iterations
# Benchmark mode: Average time, time/op
# Benchmark: bench.LongDouble.zeros
# Run progress: 50,00% complete, ETA 00:00:41
# Fork: 1 of 5
# Warmup Iteration 1: 439,529 ns/op
# Warmup Iteration 2: 437,752 ns/op
# Warmup Iteration 3: 390,530 ns/op
Iteration 1: 389,394 ns/op
Iteration 2: 391,453 ns/op
Iteration 3: 390,446 ns/op
Iteration 4: 390,822 ns/op
Iteration 5: 389,850 ns/op
# Run progress: 60,00% complete, ETA 00:00:33
# Fork: 2 of 5
# Warmup Iteration 1: 438,252 ns/op
# Warmup Iteration 2: 437,446 ns/op
# Warmup Iteration 3: 448,328 ns/op
Iteration 1: 389,979 ns/op
Iteration 2: 392,741 ns/op
Iteration 3: 390,575 ns/op
Iteration 4: 390,492 ns/op
Iteration 5: 390,000 ns/op
# Run progress: 70,00% complete, ETA 00:00:25
# Fork: 3 of 5
# Warmup Iteration 1: 447,939 ns/op
# Warmup Iteration 2: 444,489 ns/op
# Warmup Iteration 3: 414,433 ns/op
Iteration 1: 417,409 ns/op
Iteration 2: 413,518 ns/op
Iteration 3: 413,388 ns/op
Iteration 4: 414,040 ns/op
Iteration 5: 415,935 ns/op
# Run progress: 80,00% complete, ETA 00:00:16
# Fork: 4 of 5
# Warmup Iteration 1: 439,012 ns/op
# Warmup Iteration 2: 437,345 ns/op
# Warmup Iteration 3: 388,208 ns/op
Iteration 1: 395,647 ns/op
Iteration 2: 389,221 ns/op
Iteration 3: 387,539 ns/op
Iteration 4: 388,524 ns/op
Iteration 5: 387,623 ns/op
# Run progress: 90,00% complete, ETA 00:00:08
# Fork: 5 of 5
# Warmup Iteration 1: 446,116 ns/op
# Warmup Iteration 2: 446,622 ns/op
# Warmup Iteration 3: 409,116 ns/op
Iteration 1: 409,761 ns/op
Iteration 2: 410,146 ns/op
Iteration 3: 410,060 ns/op
Iteration 4: 409,370 ns/op
Iteration 5: 411,114 ns/op
Result "zeros":
399,162 ?(99.9%) 8,487 ns/op [Average]
(min, avg, max) = (387,539, 399,162, 417,409), stdev = 11,330
CI (99.9%): [390,675, 407,649] (assumes normal distribution)
# Run complete. Total time: 00:01:23
Benchmark Mode Cnt Score Error Units
LongDouble.cast avgt 25 406,975 ± 5,906 ns/op
LongDouble.zeros avgt 25 399,162 ± 8,487 ns/op
经过一些分析,我发现问题不在基准测试中,而是在 JMH 中。 perfasm
分析器指向 Blackhole.consume
方法:
public final void consume(boolean bool) {
boolean bool1 = this.bool1; // volatile read
boolean bool2 = this.bool2;
if (bool == bool1 & bool == bool2) {
// SHOULD NEVER HAPPEN
nullBait.bool1 = bool; // implicit null pointer exception
}
}
有趣的部分是 bool1
和 bool2
是如何初始化的:
Random r = new Random(System.nanoTime());
...
bool1 = r.nextBoolean(); bool2 = !bool1;
是的,每次都是随机的!如您所知,JIT 编译器依赖于运行时执行配置文件,因此生成的代码会根据 bool1
和 bool2
的初始值略有不同,特别是在一半情况下它认为分支已被占用,其余的一半未被占用。这就是差异的来源。
我已经提交了 the report针对 JMH 提出的修复建议,以防作者确认缺陷。
关于java - 这个 JMH 基准在机器之间不一致 - 为什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32411050/
我想创建一个 Python 基准测试列表。现在我只找到了 this 中的标准基准测试问题和一些来自 Computer Language Benchmarks Game . Python 还有其他基准测
我正在使用 apache 提供的基准文件 TestDFSIO 测试我的 hadoop 配置。我正在根据本教程(资源 1)运行它: http://www.michael-noll.com/blog/20
我刚刚安装了 Ruby 企业版,想对我的系统 Ruby 运行一些基准测试。是否有我应该实现的规范基准测试? 最佳答案 最有趣最深入Ruby benchmarks Antonio Cangiano 的系
我已经生成了基准,用于比较使用 ffmpeg 工具缩小视频文件 (mp4) 的两种方法。 基准以这种格式记录: x.mp4 Output_Resolution : 360p Method : A re
我正在使用 codeigniter 制作一个网站。 如果用户在他的评论中写入 {memory_usage} 2.75MB 将显示给他。它不会给 codeigniter 编写的代码带来安全漏洞吗?有什么
我正在尝试对 XSLT 的两个版本进行基准测试。目前我使用 Visual Studio 进行调试,因为从 .NET 组件调用的 xml 转换。 VS 2010 是我用于开发的 IDE。 我得到的唯一线
我想知道如何测量每个节点的内存带宽(流基准)。我的这个程序仅在一个节点上进行测量,进程和线程的数量如下: MPI_Comm_size(MPI_COMM_WORLD, &numranks); MPI_C
我正在关注 performance test Dapper 社区创建的。 目前,我在运行测试 10000 次后得到以下信息: EF 5 = 21595 毫秒 ADO.NET = 52183 毫秒 小巧
为了测量 CPU 的峰值 FLOPS 性能,我编写了一个小的 C++ 程序。但是测量结果给我的结果比我的 CPU 的理论峰值 FLOPS 大。怎么了? 这是我写的代码: #include #incl
有没有办法在 JUnit 测试套件中放置简单的开始/停止计时? 当我创建一个测试套件类时,它看起来像这样,我可以运行它。但是我怎么能在这里放一个简单的长开始时间变量来显示所有测试运行了多长时间? pu
我想测试MySQL数据库的InnoDB和MyRock引擎之间的高强度写入。为此,我使用 sysbench 进行基准测试。我的要求是: 多线程并发写入同一张表。 支持批量插入(每次插入事务都会插入大量记
我正在尝试构建一个 Nodejs Web 应用程序。当我添加更多代码时,最好有一种方法来测试此类更改对性能的影响,如果可能的话,以及我的应用程序在哪些方面花费最多时间。我目前正在使用 mocha 作为
我希望编写一个简单的每秒帧数动画基准 Javascript 实用程序。 FPS 在这里可能是一个模糊的术语,但理想情况下,它可以让我更准确地比较和衡量不同动画 (CSS3/canvas/webgl)
我是 Python 新手。这是我的第一种解释语言。到目前为止,我曾经学习过Java。因此,当 Java 程序第一次运行时,它的执行速度比下一次要慢。reasi 正在缓存。 import time de
我在 Ubuntu 虚拟机中使用 Apache 2.4.2。我用它来加载测试,向某些 HTTPS url 发送请求。失败请求数为零。但是我的请求都无法真正处理(已经在数据库中查找)。使用相同的 url
(我不确定这是否应该在 https://softwareengineering.stackexchange.com/ 上,如果您认为是,请评论) 我即将为我的学士论文创建 WebGL 实现的基准。我不
编辑: Clojure 基准测试已达到 the Benchmarks Game 。 我已经制作了这个问题社区 wiki 并邀请其他人保持更新。 有人知道 Clojure 的性能基准吗? 我自己做了一些
关注 this benchmark BSON 需要更多的磁盘空间和时间来创建、序列化、反序列化和遍历所有元素。 BSON 的一大优势是,它的遍历速度要快得多。那么这个基准有什么问题呢? 最佳答案 你的
我正在 NextFlow 上执行分散-聚集操作。 它看起来像下面这样: reads = PATH+"test_1.fq" outdir = "results" split_read_ch = chan
我无法让apache benchmark与我的网站配合使用。每当我发出此命令时 ab https://example.com/ 我会得到这个输出错误: This is ApacheBench, Ver
我是一名优秀的程序员,十分优秀!