gpt4 book ai didi

c++ - TensorFlow CPU 和 CUDA 代码共享

转载 作者:太空宇宙 更新时间:2023-11-04 12:58:19 25 4
gpt4 key购买 nike

我正在为具有共享自定义函数代码的 TensorFlow 使用 C++ 和 CUDA 编写一个 Op。通常当 CPU 和 CUDA 实现之间的代码共享时,如果为 CUDA 编译,人们会定义一个宏来将 __device__ 说明符插入到函数签名中。在 TensorFlow 中是否有以这种方式共享代码的内置方式?

如何定义可以在 CPU 和 GPU 上运行的实用函数(通常是内联的)?

最佳答案

事实证明,TensorFlow 中的以下宏将执行我描述的操作。

namespace tensorflow{
EIGEN_DEVICE_FUNC EIGEN_STRONG_INLINE
void foo() {
//
}
}

关于c++ - TensorFlow CPU 和 CUDA 代码共享,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45507534/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com