gpt4 book ai didi

compiler-errors - 使用Eigen::half on GPUDevice的自定义tensorflow C++ op中的特征值和

转载 作者:行者123 更新时间:2023-12-02 10:45:15 25 4
gpt4 key购买 nike

我正在尝试创建一个自定义的Tensorflow Op。我已经使用https://www.tensorflow.org/versions/master/how_tos/adding_an_op/index.html和普通C++进行了一些操作。

使用Eigen C++框架及其.sum reducer时会出现问题。它适用于doublefloatEigen::half类型的CPU,但是在GPU上,在编译时使用Eigen::half会中断。

我已将问题简化为https://github.com/tensorflow/tensorflow/tree/master/tensorflow/core/kernelsl2loss_op副本,在该副本中,我已将L2Loss重命名为CustomL2Loss(否则会出现名称冲突)。另请:https://gist.github.com/AndreasMadsen/4335215cd4293daad3cad745bbeae82a

错误很长:https://gist.github.com/AndreasMadsen/5cd0579267f0bc3e5a1c21f2341d9ad6

由于它适用于<GPUDevice, Eigen::half>(通过注释l2loss_op.cu.cc中的行确认)以外的所有其他情况,因此我正在考虑这是否是 tensorflow 问题。但是我可以自己编译 tensorflow 。

最佳答案

支持半浮点数要求cuda体系结构大于或等于3.5。您需要使用-arch compute_35标志进行编译以启用相应的指令。

关于compiler-errors - 使用Eigen::half on GPUDevice的自定义tensorflow C++ op中的特征值和,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40362985/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com