gpt4 book ai didi

CUDA:了解PTX信息

转载 作者:行者123 更新时间:2023-12-04 07:41:18 28 4
gpt4 key购买 nike

我找不到有关PTX信息--ptxas-options=-v的有用信息
我发现了一张2008 NVCC pdf文件,其中包含一个简短的内容,但没有详细信息。
1)64 bytes cmem[0], 12 bytes cmem[16]是什么意思?我收集到它是指不断的内存。我在代码中没有使用任何常量内存,因此这必须来自编译器。 (RO内存中有什么?)
2)49152+0 bytes smem是什么意思?是的,它是共享内存,但是两个#是什么意思?
3)是否有文档可以帮助我解决这个问题? (这叫什么?)
4)在哪里可以找到解释* .ptx文件的文档? (我希望能够阅读/理解CUDA组件代码。)

最佳答案

  • cmem是dicused here。在您的情况下,这意味着64个字节用于将参数传递给内核,而12个字节被编译器生成的常量占用。
  • 如果使用smem,则第一个数字是您的代码请求的数据量,第二个数字(0)指示用于系统目的的内存量。
  • 我不知道有关详细ptxas输出格式的任何官方信息。例如。在“CUDA占用率计算器”中,他们只是说要合计smem的值而不会产生任何爆炸。
  • nVidia website上有一些PTX文档。最基本的是PTX: Parallel Thread Execution ISA Version 3.0
  • 关于CUDA:了解PTX信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12322906/

    28 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com