gpt4 book ai didi

CUDA/PTX 32 位与 64 位

转载 作者:行者123 更新时间:2023-12-03 13:58:27 30 4
gpt4 key购买 nike

CUDA 编译器可以选择生成 32 位或 64 位 PTX。这些有什么区别?和 x86 一样,NVidia GPU 实际上有 32 位和 64 位 ISA 吗?还是仅与主机代码有关?

最佳答案

指针肯定是the most obvious difference . 64 位机器模型启用 64 位指针。 64 位指针可以实现多种功能,例如大于 4GB 的地址空间和 unified virtual addressing .统一虚拟寻址反过来又可以启用其他东西,例如 GPUDirect Peer-to-Peer . CUDA IPC API还取决于 64 位机器型号。

x64 ISA 与 x86 ISA 并不完全不同,它主要是它的扩展。熟悉 x86 ISA 的人会发现 x64 ISA 很熟悉,并在需要时对 64 位进行了自然扩展。同样,64 位机器模型是将 PTX ISA 的功能扩展到 64 位。大多数 PTX 指令的工作方式完全相同。

32 位机器模型可以处理 64 位数据类型(例如 doublelong long ),因此通常不需要对正确编写的 CUDA C/C++ 源代码进行任何更改来编译 32 位机器模型或64位机器型号。如果直接在 PTX 中编程,you may have to account for the pointer size differences , 至少。

关于CUDA/PTX 32 位与 64 位,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20624635/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com