gpt4 book ai didi

cuda - 使用 nvcc 时,arch 和 code 选项的默认值是什么?

转载 作者:行者123 更新时间:2023-12-04 02:08:34 25 4
gpt4 key购买 nike

编译 CUDA 代码时,您必须选择生成代码的架构。 nvcc提供了两个参数来指定这个架构,基本上:

  • arch指定虚拟架构,可以是compute_10 , compute_11
  • code指定真正的架构,可以是 sm_10 , sm_11

  • 所以像这样的命令:
    nvcc x.cu -arch=compute_13 -code=sm_13

    将为具有 1.3 计算能力的设备生成“cubin”代码。如果我错了,请纠正我。我想知道这两个参数的默认值是哪个? 没有值时 nvcc 使用的默认架构是什么 arch code 是指定的?

    最佳答案

    好的,我终于设法发现了默认值。我的错是没有从头到尾阅读 NVCC 文档中关于 GPU 编译的整章。所以,

    nvcc x.cu

    等价于
    nvcc x.cu –arch=compute_10 -code=sm_10,compute_10

    这些是默认值。编译默认执行到虚拟架构 compute_10 ,以及 a.out编译结果将包含 sm_10 的 CUBIN 代码。真实架构,以及 compute_10 的 PTX 汇编代码架构,如果您的架构大于 sm_10,CUDA 驱动程序将“及时”重新编译。 .

    关于cuda - 使用 nvcc 时,arch 和 code 选项的默认值是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4671607/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com