gpt4 book ai didi

c++ - 解释 gperftools 在多线程工作负载上的结果

转载 作者:太空狗 更新时间:2023-10-29 21:12:47 33 4
gpt4 key购买 nike

我正在尝试使用 gperftools 分析多线程工作负载,但在解释生成的输出时遇到困难。我编写了一个简单的程序,它启动两个具有相同工作负载的线程,并使用 gperftools cpu 分析器进行分析。在输出中,我可以看到每个线程的两个函数,但每个线程的开销从一次运行到下一次运行差异很大。我希望这两个函数显示相同的结果,因为它们是相同的工作负载,但实际上,一个可能是 90%,另一个是 10%,或者有时是 80%/20%、95%/5% 等。我不了解为什么函数显示出不同的开销,或者为什么结果从一次运行到下一次运行变化如此之大。基准测试运行了大约 5 秒,有 1600 个样本,所以应该是稳定的。

是否有任何文档说明分析如何针对多线程工作负载工作,以及如何解释输出?例如,探查器是否对每个样本的每个线程进行回溯,如果没有,它在做什么?

#include <vector>
#include <cstdlib>
#include <thread>
using namespace std;

void thread_func() {
int size = 500000;
vector<int> V(size);
for(int i = 0; i < 100000; i++) {
V.erase(V.begin() + (rand() % size));
V.insert(V.begin() + (rand() % size), rand() % 10);
}
}

void thread_func2() {
int size = 500000;
vector<int> V(size);
for(int i = 0; i < 100000; i++) {
V.erase(V.begin() + (rand() % size));
V.insert(V.begin() + (rand() % size), rand() % 10);
}
}

int main() {
srand(1234);
thread t1(thread_func);
thread t2(thread_func2);
t1.join();
t2.join();
return 0;
}

示例输出:

0   0.0% 100.0%     1429  89.3% thread_func
0 0.0% 100.0% 172 10.7% thread_func2

89.3% 和 10.7% 从何而来? (这些是函数及其调用者中样本总数的百分比)

Image contains a portion of the graph, numbers are slightly different from above because it's a different run

最佳答案

这是 SIGPROF 信号传递的已知问题。参见 https://github.com/golang/go/issues/14434了解一些细节。

Gperftools 实际上有针对偏差的“修复”(如该问题所述)。您只需要设置 CPUPROFILE_PER_THREAD_TIMERS=t 并确保链接 librt 和 libpthread。而且您还需要“注册”您的线程或 LD_PRELOAD https://github.com/alk/gperf-all-threads

关于c++ - 解释 gperftools 在多线程工作负载上的结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46242797/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com