作者热门文章
- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在对运行在 Linux 上并利用硬件加密加速设备的加密软件进行性能调优。
当负载超过某个阈值时,内核 _spn_lock
开始占用大部分 CPU 时间。以下 perf top
屏幕截图显示 ~30% 的 CPU 被 _spin_lock
占用,但如果负载增加且整体性能下降,它会上升超过 50%。
如果不找出是哪个自旋锁导致了这种情况,我就无法调整软件的性能。
我在 stackoverflow 上查看了类似的问题,但找不到关于如何发现自旋锁自旋的答案。有什么办法可以定位自旋锁的位置吗?任何提示或建议将不胜感激。
PerfTop: 81 irqs/sec kernel:45.7% exact: 0.0% [1000Hz cycles], (all, CPU: 53)
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
samples pcnt function DSO
_______ _____ _______________________ __________________________
44.00 27.2% _spin_lock [kernel.kallsyms]
30.00 18.5% sha512_block_data_order /usr/local/bin/cryptod
6.00 3.7% _int_malloc /lib64/libc-2.12.so
5.00 3.1% __GI___libc_malloc /lib64/libc-2.12.so
[root@qat ~]# uname -a
Linux qat 2.6.32-220.el6.tsx.65.x86_64 #68 SMP Fri Jan 26 17:45:32 KST 2018 x86_64 x86_64 x86_64 GNU/Linux
最佳答案
perf-lock
应该帮助你。您可以使用它捕获一些每个锁的统计信息。
关于linux - 如何找出哪个内核自旋锁占用了大部分 CPU?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48697926/
我试图让我的 SCNNode 自动水平旋转。这是我到目前为止的代码: box.scale = SCNVector3(x: 0.26, y: 0.26, z: 0.26) box.position =
我试图让我的 SCNNode 自动水平旋转。这是我到目前为止的代码: box.scale = SCNVector3(x: 0.26, y: 0.26, z: 0.26) box.position =
我试图让 unicode 三 Angular 形 (▵) 在页面加载时和用户将鼠标悬停在跨度上时旋转 360 度。我已经设置了一个 jsFiddle解释我想要什么。 ULTR▵ 我对 CS
我是一名优秀的程序员,十分优秀!