gpt4 book ai didi

linux - 应最大化哪种类型的 POWER8 PMU 事件?

转载 作者:太空狗 更新时间:2023-10-29 12:29:37 25 4
gpt4 key购买 nike

我按照 CPI breakdown model for POWER8 对在 IBM POWER8 服务器上运行的应用程序执行性能分析.

我知道我需要减少停顿的百分比,例如,缓存未命中 (PM_CMPLU_STALL_DCACHE_MISS) 或分支预测错误 (PM_CMPLU_STALL_BRU) >). POWER7 performance analysis tutorial表明编写良好的应用程序具有最终指令完成百分比 (PM_1PLUS_PPC_CMPL)。

我是否正确理解,对于 POWER8,我需要最大化 PM_GRP_CMPL 指标的百分比?我应该尝试最大化哪些其他基于 PMU 的指标?

最佳答案

指出显而易见的事实:您需要优化您的源代码最小化 PM_RUN_CYC,即完成软件任务所需的周期数。

您提供的引用将 PM_RUN_CYC 分解为 PM_CMPLU_STALL + PM_GCT_NOSLOT_CYC + PM_GRP_CMPL

您想要减少三个组件中的最大贡献者。最大限度地减少停顿,例如通过重新组织代码来减少缓存未命中。 “无槽”周期与分支预测错误和指令高速缓存未命中有关。

PM_GRP_CMPL 是“微编码指令跨越多个组的每个组将生成此事件一次。不清楚这说明了什么。在任何情况下,您都希望最小化 - 而不是最大化这些计数。

关于linux - 应最大化哪种类型的 POWER8 PMU 事件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31646843/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com