- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我正在使用 Windows 机器来获取 logback + slf4j 的性能结果
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import ch.qos.logback.classic.Level;
public class LogPerformanceAnalyser {
private static final Logger LOG =
LoggerFactory.getLogger(LogPerformanceAnalyser.class);
public LogPerformanceAnalyser() {
((ch.qos.logback.classic.Logger) LOG).setLevel(Level.ERROR);
}
public long getTimeWithCheck() {
long startTime = System.currentTimeMillis();
for (int i = 0; i < Integer.MAX_VALUE; i++) {
if (LOG.isDebugEnabled()) {
LOG.debug("This log is {} check", "with");
}
}
return System.currentTimeMillis() - startTime;
}
public long getTimeWithoutCheck() {
long startTime = System.currentTimeMillis();
for (int i = 0; i < Integer.MAX_VALUE; i++) {
LOG.debug("This log is {} check", "without");
}
return System.currentTimeMillis() - startTime;
}
}
注意-1.调试关闭2. 运行 10 次得到平均结果。
性能结果是:
Total Time getTimeWithoutCheck: 26900 ms
Total Time getTimeWithCheck : 22536 ms
结果是在记录之前放置检查为 217 亿条日志节省了约 3.5 秒。
如果我将 Logger 更改为非静态:
private final Logger LOG =
LoggerFactory.getLogger(LogPerformanceAnalyser.class);
我得到以下信息:
Total Time getTimeWithoutCheck: 37095 ms
Total Time getTimeWithCheck : 47006 ms
谁能解释一下?
最佳答案
首先,您需要正确的基准。在 Java 世界中,JMH 是事实上的基准测试标准。
基准:
@BenchmarkMode(Mode.AverageTime)
@OutputTimeUnit(TimeUnit.NANOSECONDS)
@State(Scope.Thread)
public class LogBench {
private static final Logger LOG = LoggerFactory.getLogger(LogBench.class);
private final Logger localLog = LoggerFactory.getLogger(LogBench.class);
@Benchmark
public long baseline() {
return 0;
}
@Benchmark
public void getTimeWithCheck() {
if (LOG.isTraceEnabled()) {
LOG.trace("This log is {} check", "with");
}
}
@Benchmark
public void getTimeWithoutCheck() {
LOG.trace("This log is {} check", "without");
}
@Benchmark
public void getTimeWithCheckBenchLocal() {
if (localLog.isTraceEnabled()) {
localLog.trace("This log is {} check", "with");
}
}
@Benchmark
public void getTimeWithoutCheckLocal() {
localLog.trace("This log is {} check", "without");
}
}
我将调试更改为跟踪以避免强制转换的可能影响。
结果
Benchmark Mode Samples Score Score error Units
o.o.j.s.LogBench.baseline avgt 3 0.539 0.047 ns/op
o.o.j.s.LogBench.getTimeWithCheck avgt 3 1.030 0.083 ns/op
o.o.j.s.LogBench.getTimeWithCheckLocal avgt 3 1.637 0.571 ns/op
o.o.j.s.LogBench.getTimeWithoutCheck avgt 3 1.140 0.112 ns/op
o.o.j.s.LogBench.getTimeWithoutCheckLocal avgt 3 1.628 0.311 ns/op
你可以看到,条件检查在这里没有用,但是静态版本比本地快 1.6 倍。让我们开始探索 getTimeWithCheckLocal 和 getTimeWithCheck 之间的区别。
Beginning of getTimeWithCheck:
[Verified Entry Point]
0x00007f06b920b440: mov DWORD PTR [rsp-0x14000],eax
0x00007f06b920b447: push rbp
0x00007f06b920b448: sub rsp,0x20 ;*synchronization entry
; - org.openjdk.jmh.samples.LogBench::getTimeWithoutCheck@-1 (line 65)
execution:
0x00007f06b920b44c: movabs r10,0x76d8bdfd0 ; {oop(a 'ch/qos/logback/classic/Logger')}
0x00007f06b920b456: mov r11d,DWORD PTR [r10+0x28] ;*getfield loggerContext
0x00007f06b920b45a: mov r9d,DWORD PTR [r12+r11*8+0x60] ;*getfield turboFilterList
0x00007f06b920b45f: mov r8d,DWORD PTR [r12+r9*8+0x10] ;*getfield array
...
[Verified Entry Point]
0x00007f1c592111e0: mov DWORD PTR [rsp-0x14000],eax
0x00007f1c592111e7: push rbp
0x00007f1c592111e8: sub rsp,0x30 ;*synchronization entry
; - org.openjdk.jmh.samples.LogBench::getTimeWithoutCheckLocal@-1 (line 77)
0x00007f1c592111ec: mov r11d,DWORD PTR [rsi+0xc] ;*getfield localLog
0x00007f1c592111f0: mov r10d,DWORD PTR [r12+r11*8+0x8] ; implicit exception: dispatches to 0x00007f1c59211281
0x00007f1c592111f5: cmp r10d,0xf80154ad ; {metadata('ch/qos/logback/classic/Logger')}
0x00007f1c592111fc: jne 0x00007f1c5921123c
execution:
0x00007f1c592111fe: lea r8,[r12+r11*8] ;*invokeinterface debug
0x00007f1c59211202: mov ecx,DWORD PTR [r8+0x28] ;*getfield loggerContext
您会注意到,在第二个实验中,JIT 必须对 Logger 字段值执行额外的加载:lea r9,[r12+r10*8]
。
让我们使用 perfasm 分析器再次运行基准测试
0.04% 0.04% │↗ 0x00007f6c25229320: mov r10d,DWORD PTR [r8+0xc] ;*getfield localLog
││ ; - org.openjdk.jmh.samples.LogBench::getTimeWithoutCheckLocal@1 (line 77)
││ ; - org.openjdk.jmh.samples.generated.LogBench_getTimeWithoutCheckLocal_jmhTest::getTimeWithoutCheckLocal_avgt_jmhStub@14 (line 163)
6.80% 7.29% ││ 0x00007f6c25229324: mov r11d,DWORD PTR [r12+r10*8+0x8]
││ ; implicit exception: dispatches to 0x00007f6c252294a5
0.02% ││ 0x00007f6c25229329: cmp r11d,0xf80197b1 ; {metadata('ch/qos/logback/classic/Logger')}
││ 0x00007f6c25229330: jne 0x00007f6c2522939b
││ 0x00007f6c25229332: lea r9,[r12+r10*8] ;*invokeinterface debug
││ 0x00007f6c25229336: mov ecx,DWORD PTR [r9+0x28] ;*getfield loggerContext
如您所见,这种额外加载并不是免费的。这是因为存在很多更改 final 变量的方法,因此对字段执行此优化是不安全的。
由于jvm的实验特性有一个特殊的选项-XX:+TrustFinalNonStaticFields
,它必须与-XX:+UnlockExperimentalVMOptions
一起使用。如果您使用此选项运行基准测试,您将看到另一个结果:
Benchmark Mode Cnt Score Error Units
LogBench.baseline avgt 3 2.124 ± 0.907 ns/op
LogBench.getTimeWithCheck avgt 3 0.695 ± 0.231 ns/op
LogBench.getTimeWithCheckBenchLocal avgt 3 1.608 ± 0.140 ns/op
LogBench.getTimeWithoutCheck avgt 3 0.675 ± 0.075 ns/op
LogBench.getTimeWithoutCheckLocal avgt 3 1.613 ± 0.176 ns/op
结果很奇怪,尽管现在没有额外加载局部变量,内联被破坏,asm 代码包含直接调用:
0x00007f2355205d33: call 0x00007f2355046020 ; OopMap{off=120}
;*invokespecial filterAndLog_1
TrustFinalNonStaticFields
这似乎很不稳定,因为它破坏了 CHA 优化关于java - 使用 slf4j API 的 logback 的性能问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37360301/
在C语言中,当有变量(假设都是int)i小于j时,我们可以用等式 i^=j^=i^=j 交换两个变量的值。例如,令int i = 3,j = 5;在计算 i^=j^=i^=j 之后,我有 i = 5,
我为以下问题编写了以下代码: 给定一个由 N 个正整数组成的序列 A,编写一个程序来查找满足 i > A[j]A[i](A[i] 的 A[j] 次方 > A[j] 的 A[i] 次方)。 我的代码通过
这个表达式是从左到右解析的吗?我试图解释解析的结果,但最后的结果是错误的。 int j=10, k=10; j+=j-=j*=j; //j=j+(j-=j*=j)=j+(j-j*j) k+=k*=
给定一个整数数组 A ,我试图找出在给定位置 j ,A[j] 从每个 i=0 到 i=j 在 A 中出现了多少次。我设计了一个如下所示的解决方案 map CF[400005]; for(int i=0
你能帮我算法吗: 给定 2 个相同大小的数组 a[]和 b[]具有大于或等于 1 的整数。 查找不相等的索引 i和 j ( i != j ) 使得值 -max(a[i]*b[i] + a[i] * b
每次用J的M.副词,性能显着下降。因为我怀疑艾弗森和许比我聪明得多,我一定是做错了什么。 考虑 Collatz conjecture .这里似乎有各种各样的内存机会,但不管我放在哪里M. ,性能太差了
假设一个包含各种类型的盒装矩阵: matrix =: ('abc';'defgh';23),:('foo';'bar';45) matrix +---+-----+--+|abc|defgh|23|+
是否有可能对于两个正整数 i 和 j,(-i)/j 不等于 -(i/j)?我不知道这是否可能......我认为这将是关于位的东西,或者 char 类型的溢出或其他东西,但我找不到它。有什么想法吗? 最
假设两个不同大小的数组: N0 =: i. 50 N1 =: i. 500 应该有一种方法可以获得唯一的对,只需将两者结合起来即可。我发现的“最简单”是: ]$R =: |:,"2 |: (,.N0)
我是 J 的新用户,我只是想知道 J 包中是否实现了三次样条插值方法? 最佳答案 我自己不熟悉,但是我确实安装了所有的包,所以 $ rg -l -i spline /usr/share/j/9.02
在 Q/kdb 中,您可以使用 ': 轻松修改动词,它代表每个优先级。它会将动词应用于一个元素及其之前的邻居。例如 =': 检查值对是否相等。在 J 中,您可以轻松折叠 /\ 但它是累积的,是否有成对
嗨,我有一个 4x4 双矩阵 A 1+2i 2-1i -3-2i -1+4i 3-1i -3+2i 1-3i -1-3i 4+3i 3+5i 1-2i -1-4i
刚刚发现 J 语言,我输入: 1+^o.*0j1 I expected the answer to be 0 ,但我得到了 0j1.22465e_16。虽然这非常接近于 0,但我想知道为什么 J 应该
这个问题在这里已经有了答案: With arrays, why is it the case that a[5] == 5[a]? (20 个答案) 关闭 3 年前。 我正在阅读“C++ 编程语言”
当第一行是 1, 1/2 , 1/3 ....这是支持该问题的图像。 是否存在比朴素的 O(n^2) 方法更有效的方法? 我在研究伯努利数时遇到了这个问题,然后在研究“Akiyama-Tanigawa
我写了一段Java代码,它在无限循环中运行。 下面是代码: public class TestProgram { public static void main(String[] args){
for (int i = n; i > 0; i /= 2) { for (int j = 0; j 0; i /= 2) 的第一个循环结果 O(log N) . 第二个循环for (int
如问题中所述,需要找到数组中 (i,j) 对的总数,使得 (1) **ia[j]** 其中 i 和 j 是数组的索引。没有空间限制。 我的问题是 1) Is there any approach w
for l in range(1,len(S)-1): for i in range(1,len(S)-l): j=i+l for X in N:
第二个for循环的复杂度是多少?会是n-i吗?根据我的理解,第一个 for 循环将执行 n 次,但第二个 for 循环中的索引设置为 i。 //where n is the number elemen
我是一名优秀的程序员,十分优秀!