gpt4 book ai didi

cuda - CUDA编译中如何分配寄存器

转载 作者:行者123 更新时间:2023-12-02 02:06:40 25 4
gpt4 key购买 nike

<分区>

据说每个内核的寄存器数量对于CUDA优化很重要,这个数量的上限可以通过nvcc中的“-maxrregcount=N”来设置。我无法理解这一点,因为我认为寄存器的数量可以简单地通过计算内核中的局部变量(可能还有传递的参数)来确定。我知道我错了,因为来自“nvcc --ptxas-options=-v”的报告远远超出了我所想的方式。有人可以考虑一下吗?

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com