gpt4 book ai didi

c++ - Halide 的性能计数器?

转载 作者:太空狗 更新时间:2023-10-29 20:54:25 24 4
gpt4 key购买 nike

是否有适用于使用 Halide 语言编写的代码的性能计数器?我想知道我的代码执行了多少加载、存储和 ALU 操作。

用于调度多阶段管道的 Halide 教程通过比较分配的内存量、加载、存储和对 halide Funcs 的调用来比较不同的调度,但我看不到这些信息是如何收集的。我想每次这些操作之一发生时,可以使用 trace_stores、trace_loads 和 trace_realizations 打印到控制台。这不是一个很好的选择,因为它会大大减慢程序的执行速度,并且需要某种计数脚本来将长长的控制台输出列表编译为加载、存储和 ALU 操作所需的计数。

最佳答案

我很确定他们只是使用了 trace_xxx 输出并在其上运行了一些脚本/程序。

如果您正在寻找 X86 平台上的真实性能数据,我会选择 Intel VTune Amplifier .它非常昂贵,但如果您在学术界(学生、教师、研究人员)或用于开源项目,则可能是免费的。

除此之外,通过在环境中设置HL_DEBUG_CODEGEN=1 查看降低的语句代码,您可以更好地了解循环结构和数据使用。请注意,此输出转到 stderr,而不是 stdout。

编辑:对于 Linux,有 perf .

关于c++ - Halide 的性能计数器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39215928/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com