gpt4 book ai didi

daemon - 如何使用 cachegrind 输出来优化应用程序

转载 作者:行者123 更新时间:2023-12-04 06:12:45 24 4
gpt4 key购买 nike

我需要提高系统的吞吐量。

通常的优化周期已经完成,我们已经实现了 1.5 倍的吞吐量。

我现在开始怀疑是否可以利用 cachegrind 输出来提高系统的吞吐量。

有人可以指出我如何开始吗?

我的理解是我们需要确保最常用的数据应该保持足够小,以便它保留在 L1 缓存中,而下一组数据应该适合 L2。

这是我正在采取的正确方向吗?

最佳答案

确实,cachegrind 输出本身并没有提供太多关于如何优化代码的信息。人们需要知道如何解释它,并且您所说的关于数据拟合到 L1 和 L2 的内容确实是正确的方向。

为了充分理解内存访问模式如何影响性能,我建议阅读一篇优秀论文 "What Every Programmer Should Know About Memory"由 GNU libc 维护者 Ulrich Drepper 编写。

关于daemon - 如何使用 cachegrind 输出来优化应用程序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1723997/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com