c++ - 分离库的主机端和 CUDA 设备端版本-6ren

c++ - 分离库的主机端和 CUDA 设备端版本

转载作者：行者123 更新时间：2023-11-28 01:13:55

25

4

我有一个库，其中包含一些 __host__ __device__ 函数。我还有一个 #ifdef __CUDACC__ 小工具，可确保常规 C++ 编译器看不到 __host__ __device__，从而可以编译这些函数。

现在，我想在普通 C++ 静态库文件(Linux 上的 .a)中使用我的库函数的编译主机端版本——我什至希望该库当 CUDA 不可用时可编译；我希望在单独的静态库中编译设备端版本。

我快到了(我想)，但遇到了链接错误。以下是此类库、测试程序(调用设备端和主机端版本的函数)和我使用的构建命令的玩具源代码。

我哪里错了？

my_lib.hpp(库头文件):

#ifdef __CUDACC__
__host__ __device__
#endif
void foo(int*x, int* y);
int bar();

my_lib.cu(库源):

#include "my_lib.hpp"

#ifdef __CUDACC__
__host__ __device__
#endif
void foo(int*x, int* y)  { *x = *y; }

int bar() { return 5; }

main.cu(测试程序):

#include "my_lib.hpp"

__global__ void my_kernel() {
  int z { 78 };
  int w { 90 };
  foo(&z,&w);
}

int main() {
  int z { 123 };
  int w { 456 };
  foo(&z,&w);
  my_kernel<<<1,1>>>();
  cudaDeviceSynchronize();
  cudaDeviceReset();
}

我的构建命令:

c++ -c -x c++ -o my_lib-noncuda.o my_lib.cu
ar qc my_lib-noncuda.a my_lib-noncuda.o
ranlib my_lib-noncuda.a
nvcc -dc -o my_lib-cuda.o my_lib.cu
ar qc my_lib-cuda.a my_lib-cuda.o
ranlib my_lib-cuda.a
nvcc -dc -o main.rdc.o main.cu
nvcc -dlink -o main.o main.rdc.o my_lib-cuda.a
c++ -o main main.o my_lib-noncuda.a -lcudart

我得到的错误 - 在最后一个链接命令中:

/usr/bin/ld: main.o: in function `__cudaRegisterLinkedBinary_39_tmpxft_00003f88_00000000_6_main_cpp1_ii_e7ab3416':
link.stub:(.text+0x5a): undefined reference to `__fatbinwrap_39_tmpxft_00003f88_00000000_6_main_cpp1_ii_e7ab3416'
/usr/bin/ld: main.o: in function `__cudaRegisterLinkedBinary_41_tmpxft_00003f69_00000000_6_my_lib_cpp1_ii_ab44b3f6':
link.stub:(.text+0xaa): undefined reference to `__fatbinwrap_41_tmpxft_00003f69_00000000_6_my_lib_cpp1_ii_ab44b3f6'
collect2: error: ld returned 1 exit status

注意事项:

我在 Devuan GNU/Linux 上使用 CUDA 10.1 和 g++ 9.2.1。
这是对已删除问题的“跟进”； @talonmies 评论说我最好准确地展示我做了什么；这在一定程度上改变了问题。
有点相关的问题:this one。

最佳答案

这是创建两个库的方法，一个仅包含 CUDA 设备函数，另一个仅包含主机函数。您可以省略“复杂的”#if 和 #ifndef 守卫。但是你的库 my_lib-cuda.a 中也会有“非 CUDA 代码”。

对于其他问题，请参阅@talonmies 社区维基答案或引用我已经在评论中发布的链接:https://devblogs.nvidia.com/separate-compilation-linking-cuda-device-code/ - “高级用法:使用不同的链接器”部分。

my_lib.cu

#include "my_lib.hpp"

#ifdef __CUDA_ARCH__
__device__
#endif
#if (defined __CUDA_ARCH__) || (not defined __CUDACC__)
void foo(int*x, int* y)  { *x = *y; }
#endif

#ifndef __CUDACC__
int bar() { return 5; }
#endif

库的构建过程保持不变:(只是将 ar qc 更改为 ar rc 以替换现有文件，因此在重建时不会出现错误事先删除库)

c++ -c -x c++ -o my_lib-noncuda.o my_lib.cu
ar rc my_lib-noncuda.a my_lib-noncuda.o
ranlib my_lib-noncuda.a
nvcc -dc -o my_lib-cuda.o my_lib.cu
ar rc my_lib-cuda.a my_lib-cuda.o 
ranlib my_lib-cuda.a

构建 CUDA 程序:(通过仅使用 nvcc 而不是 c++ 来简化，或者查看@talonmies 社区维基答案)

nvcc -dc main.cu -o main.o
nvcc main.o my_lib-cuda.a my_lib-noncuda.a -o main

如果您还省略 my_lib 中的 #if 和 #ifndef，则可以省略指向 my_lib-noncuda.a 的链接.cu 如上所述。

构建 C++ 程序:(假设 #ifdef __CUDACC__ 保护 main.cu 中的 CUDA 代码)

c++ -x c++ -c main.cu -o main.o
c++ main.o my_lib-noncuda.a -o main

关于c++ - 分离库的主机端和 CUDA 设备端版本，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59359697/

25

4

0

文章推荐： javascript - 分配处理成本与条件

文章推荐： c++ - 关于如何处理vulkan queue family的问题

文章推荐： c++ - 堆栈数组 C++ 的 Strcpy 行为

iphone - iphone 设备 UDID 、 iphone 设备 ID 和 iphone 设备 token 之间有什么区别？
iphone设备UDID、iphone设备ID和iphone设备Token之间有什么区别？通常，当我们使用苹果推送通知服务时，会使用 iPhone 设备 token 。但我的目标只是识别唯一的 i
android - 发送数据到 Android 设备 Notification to IOS 设备
我们使用 firebase 从服务器向 Android 和 IOS 设备发送通知，并且我们使用旧版 FCM 发送通知。但是当我们的应用程序在后台时，通知由系统本身处理，因此我们无法通过应用程序处理它。
iphone - 如何通过蓝牙将 iOS 设备连接到非 iOS 设备(Arduino 设备)？
在 Google 上搜索后，我发现人们说只能通过“MFi 程序”将 iOS 设备与非 iOS 设备连接起来。这是真的吗？我的项目主要集中于直接通过蓝牙与Arduino设备发送和接收信息。 iOS和非
objective-c - 如果(设备 == iPad)，如果(设备 == iPhone)
所以我有一个通用应用程序，我正在设置 UIScrollView 的内容大小。显然，iPhone 和 iPad 上的内容大小会有所不同。如何为 iPad 设置某种尺寸，为 iPhone 和 iPod t
kubernetes - 如何使用连接到主机的 block 设备，作为 pod 中的 block 设备
问题:如何在 pod 中使用连接到主机的原始设备作为 block 设备。我尝试使用类型为“BlockDevice”的“hostPath” volumes: - my-data: hostPath
ios - Google Cast 设备 DidComeOnline(设备 : GCKDevice!)从未被调用 #GoogleCastSDK
Implemented GCKDeviceScannerListener Singleton Class on ViewController, however its delegate methods
iOS APNS 设备 ID 与 Passbook 设备 ID 不匹配
我有一个 (PhoneGap) 应用程序，它将成功获得 Passbook 通行证，并且还将成功接收与 Passbook 分开的推送通知(当伪造设备 ID 时)。我遇到的问题是发送给注册设备的设备 I
ios - 访问电池供电的 iBeacon 设备(主要是 kontakt io 设备)的电池电量？
我正在尝试找到一种方法，通过我目前正在使用的 iOS 应用程序访问我的信标的电池电量。我正在使用 Kontakt 的 iBeacon 设备。我浏览了 Estimote iOS SDK，他们提供了一种实
c - NVAPI 设备 ID 与 CUDA 设备 ID 有何关系？
我正在努力让 CUDA 应用程序也能监控 GPU 的核心温度。可通过 NVAPI 访问该信息。问题是我想确保在运行代码时监控的是同一个 GPU。但是，似乎有信息表明我从 NvAPI_EnumPhy
沙盒中的 iPhone APNS 设备 token 与生产环境中的 iPhone APNS 设备 token
从沙箱模式到生产模式，设备 token 有何不同？我认为我已将一些设备 token 锁定为生产模式，并且无法将它们从开发中插入。关于如何检查有什么想法吗？最佳答案当您使用开发证书构建应用程序时
android - 文件管理器检测到 Android 设备，但 gvfs 文件夹为空。如何从终端访问 MTP 设备？
目录 /run/user/1000/gvfs 和 ~/.gvfs 分别是空的和不存在的。我的图形文件管理器 (Thunar) 能够检测和访问设备的内部和外部存储器。命令 gvfs-mount -l
Android 平板电脑无法通过 USB 端口找到 USB 设备，但可以通过 OTG 线找到 USB 设备
我有一个 Android 平板电脑，它有一个迷你 USB 端口和一个 USB 端口，我想编写一个与 USB key 通信的应用程序。我写了一个demo来找出U盘，但是没有任何反应。令我不安的是，如果
php - SOAP 网络服务不仅仅适用于 IOS 设备，它适用于 soap ui 和 Android 设备
我们将 PHP 版本从 5.4.25 更改为 5.4.45，并在服务器上安装了 MS SQL 驱动程序。在更改服务器之前，一切正常，但在更改服务器之后，我遇到了 Web 服务问题。我们的身份验证 So
支持从两个后置摄像头同时捕获的 Android 设备
我想知道是否有人使用此 API 在 Android 设备上同时从 2 个后置摄像头捕获图像或视频:https://source.android.com/docs/core/camera/concurr
可以接受强制门户上的条款的嵌入式 WiFi 设备？
我正在为客户构建一个物联网解决方案，网络管理员坚持要求设备仅通过访客网络进行连接，该网络有一个强制门户，其中的服务条款必须通过按下 UI 按钮来接受，然后才能获得外部互联网访问。到目前为止，我见过的大
delphi - 使用delphi检测USB驱动器/设备
我无法弄清楚这里的格式规则..在我的示例中，代码行太多，无法为每行添加 4 个空格，因此这里是我需要帮助的代码的链接 http://nitemsg.blogspot.com/2011/01/heres
iOS 设备 token
如果我在我的设备上接受推送通知，并且不保存设备 token ，那么我如何在自定义 View 中查看设备 token 或恢复警报 View ？我删除了应用程序并重新安装，但看不到设备 token 警报
多线程复制 block 设备
我试图找出在尝试并行比较和复制设备 block 与 pthreads 时我做错了什么。看起来我正在脱离同步并且比较阶段无法正常工作。任何帮助将不胜感激 #ifndef __dbg_h__ #defin
Android 相对布局和不同的屏幕尺寸/设备
我刚刚写完所有这些内容，但这个红色的小栏告诉我我不能发布图片或两个以上的链接。因此，如果您可以引用 this Imgur album ，那简直太好了。谢谢。我在这里相对较新，甚至对 android
MySQL --> 启用常规日志并将其移动到另一个驱动器/设备
我需要启用 mysql 常规日志并将其通过 nsf 移动到我系统中的另一个驱动器/设备! 所以，我在 my.cnf 中启用了它: general_log = 1 general_log_fi

首页

博学

6Ren·AI

商城

c++ - 分离库的主机端和 CUDA 设备端版本