gpt4 book ai didi

cuda - 使用CUDA时如何测量每个 block 的执行时间?

转载 作者:行者123 更新时间:2023-12-04 22:08:26 27 4
gpt4 key购买 nike

clock() 不够准确。

最佳答案

使用 CUDA 事件测量内核或 CUDA 操作(memcpy 等)的时间:

// Prepare
cudaEvent_t start, stop;
cudaEventCreate(&start);
cudaEventCreate(&stop);
// Start record
cudaEventRecord(start, 0);
// Do something on GPU
MyKernel<<<dimGrid, dimBlock>>>(input_data, output_data);
// Stop event
cudaEventRecord(stop, 0);
cudaEventSynchronize(stop);
float elapsedTime;
cudaEventElapsedTime(&elapsedTime, start, stop); // that's our time!
// Clean up:
cudaEventDestroy(start);
cudaEventDestroy(stop);

参见 CUDA 编程指南,第 3.2.7.6 节

关于cuda - 使用CUDA时如何测量每个 block 的执行时间?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3553843/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com