gpt4 book ai didi

CUDA - 实现设备 HashMap ?

转载 作者:行者123 更新时间:2023-12-02 20:19:01 25 4
gpt4 key购买 nike

有人有在 CUDA 设备上实现 HashMap 的经验吗?具体来说,我想知道如何在设备上分配内存并将结果复制回主机,或者是否有任何有用的库可以促进此任务。

似乎我需要先验地知道 HashMap 的最大大小才能分配设备内存。我之前所有的 CUDA 工作都使用了数组和 memcpy,因此相当简单。

任何对此问题的见解都值得赞赏。谢谢。

最佳答案

Jason Sanders 和 Edward Kandrot 的“CUDA 示例”中介绍了 GPU 哈希表实现。

幸运的是,您可以在此页面获取本书的信息并免费下载示例源代码:
http://developer.nvidia.com/object/cuda-by-example.html

在此实现中,表在 CPU 上预先分配,并通过基于原子函数atomicCAS(比较和交换)的锁定函数确保安全的多线程访问。

此外,较新的硬件一代(从 2.0 开始)与 CUDA >= 4.0 相结合应该能够在 GPU 上直接使用 new/delete 运算符 ( http://developer.nvidia.com/object/cuda_4_0_RC_downloads.html?utm_source=http://forums.nvidia.com&utm_medium=http://forums.nvidia.com&utm_term=Developers&utm_content=Developers&utm_campaign=CUDA4 ),这可以为您的实现服务。我尚未测试这些功能。

关于CUDA - 实现设备 HashMap ?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5533102/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com