linux - 在 `perf stat` 的输出上运行 `perf record` ？-6ren

linux - 在 `perf stat` 的输出上运行 `perf record` ？

转载作者：行者123 更新时间：2023-12-03 09:51:26

25

4

与 perf (the Linux profiler) , (v4.15.18)，我可以运行 perf stat $COMMAND 来获取命令的一些简单统计信息。如果我运行 perf record，它会将大量数据保存到 perf.data 文件中。

我可以在 perf record 的输出上运行 perf stat 吗？这样我既可以查看 perf 记录的数据，又可以得到一个简单的概览？

最佳答案

perf stat 在计数模式下使用 hardware performance monitoring unit，perf record/perf report with perf.data 文件在溢出模式下使用相同的单元。在这两种模式下，hardware performance counters 都通过控制寄存器配置为某种性能事件(例如 cpu 周期或执行的指令)，并且计数器将在每个事件上递增。

在计数模式下，perf stat 将在程序启动时将计数器配置为零，并在程序退出时读取最终计数器值(实际上计数可能会分成几个部分，结果相同 - 完整运行的单个值)。

在分析模式 (sampling profiling) 中，perf record 会将计数器配置为某个负值，例如 -100000 和溢出处理程序将被安装(实际值将自动调整为某个频率)。每发生 100000 个事件，计数器就会溢出到零并产生一个中断。 perf_events 中断处理程序会将“样本”(当前时间、pid、指令指针、可选的 -g 中的调用堆栈)记录到环形缓冲区中，并将其保存到 perf.data 中。此处理程序还将再次将计数器重置为 -100000。因此，在运行足够长的时间后，将有数千个样本存储在 perf.data 中，可用于生成程序的统计概况(程序的哪些部分运行得更频繁)。

perf stat 显示什么？在 x86_64 cpu 的默认模式下:程序的运行时间(任务时钟和已用时间)、3 个软件事件(上下文切换、cpu 迁移、页面错误)、4 个硬件计数器:周期、指令、分支、分支未命中:

$ echo '3^123456%3' | perf stat bc
0
 Performance counter stats for 'bc':
        325.604672      task-clock (msec)         #    0.998 CPUs utilized          
                 0      context-switches          #    0.000 K/sec                  
                 0      cpu-migrations            #    0.000 K/sec                  
               181      page-faults               #    0.556 K/sec                  
       828,234,675      cycles                    #    2.544 GHz                    
     1,840,146,399      instructions              #    2.22  insn per cycle         
       348,965,282      branches                  # 1071.745 M/sec                  
        15,385,371      branch-misses             #    4.41% of all branches        
       0.326152702 seconds time elapsed

perf record 记录了什么？在单个唤醒事件(环形缓冲区溢出)中，它确实将 1246 个样本保存到 perf.data 中，并且使用了默认的硬件事件(周期)

$ echo '3^123456%3' | perf record bc
[ perf record: Woken up 1 times to write data ]
[ perf record: Captured and wrote 0.049 MB perf.data (1293 samples) ]

使用 perf report --header|less 、 perf script 和 perf script -D 您可以查看 perf.data 内容:

$ perf report --header |grep event
# event : name = cycles:uppp, , size = 112, { sample_period, sample_freq } = 4000, sample_type = IP|TID|TIME|PERIOD ...
# Samples: 1K of event 'cycles:uppp'
$ perf script 2>/dev/null |grep cycles|wc -l 
1293

perf.data 中有一些时间戳和程序启动和退出的一些附加事件 (perf script -D |egrep exec\|EXIT)，但默认 perf.data 中没有足够的信息来完全重建 perf stat 输出。运行时间仅记录为开始和退出的时间戳，并且在每个事件样本中，不记录软件事件，仅使用单个硬件事件(周期；无指令、分支、分支未命中)。可以对已用硬件计数器进行近似计算，但并不准确(实际周期约为 820-8.25 亿):

$ perf report --header |grep Event
# Event count (approx.): 836622729

使用 perf.data 的非默认记录可以估计更多事件:

$ echo '3^123456%3' | perf record -e cycles,instructions,branches,branch-misses bc
[ perf record: Captured and wrote 0.238 MB perf.data (5164 samples) ]
$ perf report --header |egrep Event\|Samples
# Samples: 1K of event 'cycles'
# Event count (approx.): 834809036
# Samples: 1K of event 'instructions'
# Event count (approx.): 1834083643
# Samples: 1K of event 'branches'
# Event count (approx.): 347750459
# Samples: 1K of event 'branch-misses'
# Event count (approx.): 15382047

所以，你 can't run perf stat on perf.data file ，但你可以要求 perf report 打印带有事件计数估计的标题。您也可以尝试从 perf script/perf script -D 解析时间戳。

关于linux - 在 `perf stat` 的输出上运行 `perf record` ？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/62550369/

25

4

0

文章推荐： c - 我如何覆盖加载了 dlopen 的库中的全局符号？

文章推荐： python - 如何在 Python 中重新加载环境变量？

文章推荐： linux - posix aio 和 freebsd aio 有什么区别？

文章推荐： c - 'rename(2) old new' 然后 'stat(2) new' 序列可能失败？

mysql - 从 bash 输出 sql 输出
我正在使用 OUTFILE 命令，但由于权限问题和安全风险，我想将 shell 的输出转储到文件中，但出现了一些错误。我试过的 #This is a simple shell to connect t
JAVA——程序功能为输入输出、输入输出；想让程序的功能分别为输入输入、输出、输出
我刚刚开始学习 Java，我想克服在尝试为这个“问题”创建 Java 程序时出现的障碍。这是我必须创建一个程序来解决的问题: Tandy 喜欢分发糖果，但只有 n 颗糖果。对于她给第 i 个糖果的人，
c++ - 无法使用 ostream 输出 C++ 输出 vector
你好，我想知道我是否可以得到一些帮助来解决我在 C++ 中打印出 vector 内容的问题我试图以特定顺序在一个或两个函数调用中输出一个类的所有变量。但是我在遍历 vector 时收到一个奇怪的错误
gradle - 重复生成的类 gradle 输出 (build/...) 与 intellij 输出 (out/...)
我正在将 intellij (2019.1.1) 用于 java gradle (5.4.1) 项目，并使用 lombok (1.18.6) 来自动生成代码。 Intellij 将生成的源放在 out
javascript - 如何从 JavaScript 输出 JSON 输出，以便将其识别为 JSON？
编辑:在与 guest271314 交流后，我意识到问题的措辞(在我的问题正文中)可能具有误导性。我保留了旧版本并更好地改写了新版本背景: 从远程服务器获取 JSON 时，响应 header 包含一
java - StoredProcedureCall 1x Varchar 输出 1x Cursor 输出
我的问题可能有点令人困惑。我遇到的问题是我正在使用来自 Java 的 StoredProcedureCall 调用过程，例如: StoredProcedureCall call = new Store
com - COM IDL定义中[输入，输出]和[输出，检索]之间的差异
在我使用的一些IDL中，我注意到在方法中标记返回值有2个约定-[in, out]和[out, retval]。当存在多个返回值时，似乎使用了[in, out]，例如: HRESULT MyMetho
linux - 我如何告诉 `gar` 或 `ar` 输出 `elf32-i386` 输出？
当我查看 gar -h 的帮助输出时，它告诉我: [...] gar: supported targets: elf64-x86-64 elf32-i386 a.out-i386-linux [...
r - Knitr HTML Loop - 一些 HTML 输出，一些 R 输出
我想循环遍历一个列表，并以 HTML 格式打印其中的一部分，以代码格式打印其中的一部分。所以更准确地说:我想产生与这相同的输出 1 is a great number 2 is a great
"Error running git [init /workspace/output/]: exit status 1\n/workspace/output/.git: Permission denied\n"(“运行git[init/工作区/输出/]时出错：退出状态1\n/工作区/输出/.git：权限被拒绝\n”)
我有下面的tekton管道，并尝试在Google Cloud上运行。集群角色绑定。集群角色。该服务帐户具有以下权限。。例外。不确定需要为服务帐户设置什么权限。
Grepping 输出
当尝试从 make 过滤非常长的输出以获取特定警告或错误消息时，第一个想法是这样的: $ make | grep -i 'warning: someone set up us the bomb' 然而
Kotlin中抽象容器工具的泛型输入/输出？
我正在创建一个抽象工具类，该类对另一组外部类(不受我控制)进行操作。外部类在某些接口(interface)点概念上相似，但访问它们相似属性的语法不同。它们还具有不同的语法来应用工具操作的结果。我创建了
Python奇怪的按位与(&)输出
这个问题已经有答案了: What do numbers starting with 0 mean in python? (9 个回答) 已关闭 7 年前。在我的代码中使用按位与运算符 (&) 时，我
Python文件输入/输出
我写了这段代码来解析输入文件中的行输入格式:电影 ID 可以有多个条目，所以我们应该计算平均值输出:**没有重复(这是问题所在) import re f = open("ratings2.txt",
更高效的Python输入/输出
我需要处理超过 1000 万个光谱数据集。数据结构如下:大约有 1000 个 .fits(.fits 是某种数据存储格式)文件，每个文件包含大约 600-1000 个光谱，其中每个光谱中有大约 450
C编程频率计数器输入/输出
我编写了一个简单的 C 程序，它读取一个文件并生成一个包含每个单词及其出现频率的表格。该程序有效，我已经能够在 Linux 上运行的终端中获得显示的输出，但是，我不确定如何获得生成的显示以生成包含词
C语言音频输入/输出
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 1
python中的print()输出
1.普通的输出： print(str)#str是任意一个字符串，数字··· 2.格式化输出： ?
logstash 简单文件输入/输出
我无法让 logstash 正常工作。 Basic logstash Example作品。但后来我与 Advanced Pipeline Example 作斗争.也许这也可能是 Elasticsear
audio - 快速音频输入/输出
这是我想要做的: 我想让用户给我的程序一些声音数据(通过麦克风输入)，然后保持 250 毫秒，然后通过扬声器输出。我已经使用 Java Sound API 做到了这一点。问题是它有点慢。从发出声音到

首页

博学

6Ren·AI

商城

linux - 在 `perf stat` 的输出上运行 `perf record` ？