- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在尝试调试多线程C++应用程序的性能问题。基本上,我的多线程程序(10个线程)比单线程程序慢。
我一直在尝试诸如valgrind(callgrind),gprof和gdb之类的工具。但是到目前为止,我仍无法弄清楚线程在何处被阻塞以及原因。 gprof和callgrind给了我大量的时间在每个功能上。但是,这段时间是否包括线程阻塞某物的时间?是否有任何可用于调试此问题的开源工具。
最佳答案
即使我没有立即可用的答案,我也会在这里从注释中切换,因为还有更多的空间可以编写和格式化。
您能否澄清“lahks”一词?我仅找到something loosely related on Wiki,但纯粹是猜测,我不知道您的意思。
您说的large number of objects per thread
。当您随机采样/停止时,您是否看过堆栈跟踪?我知道alloc/dealloc是堆栈跟踪中最常出现的叶子,但是* nonleaf * s呢?您是否能够看到实际上在调用那个alloc/dealloc的内容?这就是采样方法的重点-查看调用的原始信息,并从统计角度估计哪些可能的起源是造成调用频率太高的原因。
由于繁重的优化或由于体系结构不匹配,您可能无法观察到堆栈跟踪的“较高部分”(即,如果您的应用程序使用任务排队,那么在大多数情况下,您只会看到“提取任务”,”检查任务”,“执行任务”步骤而不是真正的来源),但是几乎在每种体系结构中,您都可以进行适当调整(就任务排队而言,只需尝试采样任务注册即可!)
另一种方式-alloc/dealloc膨胀非常普遍:它通常与体系结构和算法有关,或者与bug有关。但是,这种情况不仅应该在“优化发行版”构建中很容易观察到(在查看堆栈跟踪时存在问题),而且还应该在“完整调试信息”构建中迅速出现-较少的优化整个系统将运行速度较慢,但是您应该能够查看和收集所有可能的起源的中间方法。
另一件事:您已经说过“多线程”的工作要比“单线程”慢得多。这就对提出了一个问题,您如何在之间进行切换?您是否有两个单独的实现?还是只在1个workerthread和N个workerthread之间调整线程池大小?将其与“分配/解除分配”问题交叉使用-也许您的每个线程每次都需要执行太多的设置/拆卸操作?
尝试检查实际的线程(作为一个组,也要查看线程的生命周期)必须重复准备,而与单线程选项形成对比。
例如,单线程以某种方式节省了分配/取消分配并可能重用了某些结构),而N线程可能需要N倍的相同结构。如果线程只是反复启动/停止并且不被重用,那么它们的N *数据也可能不会被重用,因此N线程可能只是在实际工作之前浪费时间进行准备。
另外,如果您设法捕获了无关的分配方案-为什么不进一步追踪:停止后,退出分配器并尝试查看正在分配的内容。我的意思是,您可以逐步检查该内存中正在写入的内容,这可以使您进一步了解实际发生的情况。但是,这可能是一项非常艰巨的任务,尤其是因为它必须重复很多次。我将其保留为最后的手段。
另一件事是-纯粹的猜测-您的平台可能在alloc/dealloc内部具有一些全局锁定,以“安全地跟踪”内存管理。这样,如果所有线程根据需要管理自己的内存,则线程将在每个内存分配/取消分配操作中互相等待。更改内存分配方案,或使用其他内存管理器,或使用堆栈或TLS,或将线程池拆分为单独的进程可能会有所帮助,因为它将避免全局锁定的需要。但是,这只是一个非常遥远的猜测,没有一种解决方案易于应用。
我为这样笼统而含糊的谈话感到抱歉。仅提供您的一些细节,很难说更多。我故意回避“使工作可视化的工具”主题。如果仅通过sample/stop方法无法看到正在发生的事情,那么所有可能的“线程可视化”工具都可能无济于事:它们可能会向您显示与现在所见完全相同的东西,因为它们都可以进行分析相同的堆栈跟踪,仅比手动停止快一点。
关于c++ - 可视化每个线程正在运行的功能的工具,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17402092/
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它,visit the help center 。
目录 内置的高亮节点 自定义高亮 自定义高亮时保持原始颜色 总结 案例完整代码 通过官方文档,可知高
目录 32.go.Palette 一排放两个 33.go.Palette 基本用法 34.创建自己指向自己的连线 35.设置不同的 groupTemplate 和
目录 41.监听连线拖拽结束后的事件 42.监听画布的修改事件 43.监听节点被 del 删除后回调事件(用于实现调用接口做一些真实的删除操作) 44.监听节点鼠标
织梦初秋 那是一个宜人的初秋午后,阳光透过窗户洒在书桌上,我轻轻地拂去被阳光映照出的尘屑,伸了个懒腰。哎呀,这个世界真是奇妙啊,想到什么就能用代码实现,就像笔尖上点燃的火花。 思索的起点 我一直对天气
曲径通幽,古木参天 时光匆匆,不经意间已是2023年的秋季。我身处在这个充满朝气和变革的时代,每天都充满了新的科技突破和创新。而当我想起曾经努力学习的Python编程语言时,心中涌动着一股热情,渴望将
我有一个堆积条形图,由一个 bool 字段分割。这会导致图例显示为两种颜色(很酷!)但图例具有以下值:true 和 false。对于读者来说,什么是真或假意味着什么是没有上下文的。 在这种情况下,字段
我想在 R 中做一个简单的一阶马尔可夫链。我知道有像 MCMC 这样的包,但找不到一个以图形方式显示它的包。这甚至可能吗?如果给定一个转换矩阵和一个初始状态,那将会很好,人们可以直观地看到通过马尔可夫
我是 tableau 的新手,我有以下可视化,这是链接: My visualization 我的问题是我不知道如何在一个仪表板中添加多个仪表板作为选项卡。在我的可视化中,有三个仪表板“Nota tot
我建立类似自动VJ程序的东西。我有2个网络摄像头发出的2个incomig视频信号和一些可视化效果(目前2个,但我想要更多)。我有一个以dB为单位的传入音频信号音量,以bpm为单位。我需要的是视频输出的
我需要可视化的东西,并想要求一些提示和教程。或者使用哪种技术(Cocos2D、OpenGL、Quartz,...) 这里有人在 iOS 设备上做过可视化吗? 它是关于移动物体、褪色、粒子等等…… 任何
我对 Graphviz 越来越熟悉,想知道是否可以生成如下所示的图表/图表(不确定你叫它什么)。如果没有,有人知道什么是好的开源框架吗? (首选,C++,Java 或 Python)。 最佳答案 根据
问题很简单——我真的很喜欢用 UIStackView 来组织 UI。但是,我在测试应用程序中看不到 UIStackView 边界。当 UI 元素不是预期的时候,我需要花很多时间来调试。在网上搜索,我找
例如,我可以通过以下方式分配内存时的情况: Position* arr1 = new Position[5]; Position 是我程序中的一个类,它描述了具有 x 和 y 值的位置点。 堆栈上会有
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 5 年前。
我最近一直在处理许多半复杂的 XSD,我想知道:有哪些更好的工具可以处理 XML 模式?有没有图形工具? 独立的或基于 Eclipse 的是理想的选择,因为我们不是 .net 商店。 最佳答案 我找到
通过一段时间的使用和学习,对G6有了更一步的经验,这篇博文主要从以下几个小功能着手介绍,文章最后会给出完整的demo代码。 目录 1. 树图的基本布局和
三维数据的获取方式 RGBD相机和深度图 代码展示:在pcl中,把点云转为深度图,并保存和可视化 三维数据的获取方式 在计算机视觉和遥感领域,点云可以通过四种主要的技术获得, (1)根据图像衍生而得,
代码 library(igraph) g <- graph.tree(n = 2 ^ 3 - 1, children = 2) node_labels <- c("", "Group A", "Gro
我正在关注 this tutorial并创建了一个这样的图表: from dask.threaded import get from operator import add dsk = { 'x
我是一名优秀的程序员,十分优秀!