- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在编写一个包含多个内核调用的 c++/CUDA 库。
编辑:我觉得原来的帖子有点长,所以我创建了一个更好的例子。原帖如下。
这是简化为最小示例的项目。它不会编译,并给出以下错误:
nvcc -Xcompiler -fPIC -x cu -c -dc -o myclass.o myclass.cpp
nvcc -Xcompiler -fPIC --lib myclass.o kernel.cu -o libhelpme.a -I.
ptxas fatal : Unresolved extern function '_ZN7myclassC1Ei'
makefile:8: recipe for target 'lib' failed
make: *** [lib] Error 255
关于此主题的所有文档都指向编译可执行文件或目标文件;我不想做这些,而是专门做一个静态库。我该怎么做?
代码:
生成文件
program: class lib
nvcc -o program main.cc -I. -L. -lhelpme
class:
nvcc -Xcompiler -fPIC -x cu -c -dc -o myclass.o myclass.cpp
lib: class
nvcc -Xcompiler -fPIC --lib myclass.o kernel.cu -o libhelpme.a -I.
clean:
rm *.o *.a program
main.cc
#include "stdio.h"
#include <iostream>
#include "kernel.h"
int main()
{
std::cout << "hello world" << std::endl;
wrapper();
return 0;
}
myclass.h
#ifdef __CUDACC__
#define COMMON __host__ __device__
#else
#define COMMON
#endif
#ifndef M
#define M
class myclass
{
public:
int x;
COMMON myclass(int y);
COMMON void increment();
};
#endif
myclass.cpp
#include "myclass.h"
#ifdef __CUDACC__
#define COMMON __host__ __device__
#else
#define COMMON
#endif
COMMON myclass::myclass(int y)
{
x = y;
}
COMMON void myclass::increment()
{
x += 1;
}
内核.h
extern void wrapper();
内核.cu
#include "stdio.h"
#include <iostream>
#include "myclass.h"
class myotherclass
{
public:
int x;
COMMON myotherclass(int y) {x = y;}
COMMON void decrement() {x -= 1;}
};
__global__ void dokernel()
{
myotherclass p(8); //This compiles just fine.
myclass q(7); //This will not compile
}
void wrapper()
{
std::cout << "hello from wrapper\n";
myclass q(1);
myotherclass s(4);
std::cout << "x = " << s.x << "\n";
s.decrement();
std::cout << "x = " << s.x << "\n";
dokernel<<<1,1>>>();
}
我慢慢地确信这是不可能的......
原始帖子:我有许多 C++ 源/头文件,例如vec.cpp
和 vec.h
被编译成目标文件,例如vec.o
这是一个例子:vec.h
class vec
{
public:
realnum x,y,z;
__host__ __device__ vec(float _x, float _y, float _z);
}
vec.cpp
__host__ __device__ vec::vec(float _x, float _y, float _z) {x = _x; y = _y; z = _z;}
这是我的完整 makefile(仍在制作中):
CC=nvcc
CFLAGS = -Wall -g -O3
HOME_DIR = $(shell pwd)
SRC_DIR := ${HOME_DIR}/../src
OBJ_DIR := ${HOME_DIR}/../lib
LIB_DIR := ${HOME_DIR}/../lib
KER_DIR := ${HOME_DIR}/../kernel
SRC_FILES := $(wildcard $(SRC_DIR)/*.cpp)
OBJ_FILES := $(patsubst $(SRC_DIR)/%.cpp,$(OBJ_DIR)/%.o,$(SRC_FILES))
LPROPS := -L${LIB_DIR} -lcuprops
LMAIN := -L${LIB_DIR} -lsharc
LRDR := -L${LIB_DIR} -lcurdr
INCL_PROPS := -I${SRC_DIR} -I${KER_DIR}
program: $(LIB_DIR)/libcurdr.so ${LIB_DIR}/libsharc.so $(LIB_DIR)/libcuprops.so $(OBJ_FILES)
${CC} -o $@ main.cc -I${SRC_DIR} ${LPROPS} ${LMAIN} ${LRDR}
${LIB_DIR}/libsharc.so: $(OBJ_FILES) $(LIB_DIR)/libcuprops.so
${CC} -Xcompiler -fPIC --shared ${OBJ_FILES} -o $(LIB_DIR)/libsharc.so ${INCL_PROPS}
$(OBJ_DIR)/%.o: $(SRC_DIR)/%.cpp
${CC} -Xcompiler -fPIC -dc -o $@ $< ${INCL_PROPS}
$(LIB_DIR)/libcuprops.so:
${CC} -Xcompiler -fPIC --shared -o $(LIB_DIR)/libcuprops.so ${KER_DIR}/nvidia_properties.cu ${INCL_PROPS}
$(LIB_DIR)/libcurdr.so: $(OBJ_FILES)
${CC} -Xcompiler -fPIC --shared ${OBJ_FILES} ${KER_DIR}/gpu_rdr.cu -o $(LIB_DIR)/libcurdr.so ${INCL_PROPS}
clean:
rm ${LIB_DIR}/*
当我make
时,我得到以下信息:
ptxas fatal : Unresolved extern function '_ZN3vecC1Eddd'
我有一个内核,我在其中尝试初始化一个 vector :
__global__ void SOME_KERNEL()
{
int row = blockIdx.y*blockDim.y + threadIdx.y;
int col = blockIdx.x*blockDim.x + threadIdx.x;
if (row < dev_height && col < dev_width)
{
vec t(0,0,0); //Compiles nicely when I comment out this line!
}
}
我读过 separate compiling and linking据称典型的项目架构(我相信我正在使用)通过以下方式与单独的编译和链接兼容:
objects = main.o particle.o v3.o
all: $(objects)
nvcc -arch=sm_20 $(objects) -o app
%.o: %.cpp
nvcc -x cu -arch=sm_20 -I. -dc $< -o $@
clean:
rm -f *.o app
注意“-dc”标志的使用,它与this一致回答。
在这一点上,我已经尝试了很多东西,以至于我完全迷失了。那么,我该如何编译这个项目呢?
在有用的情况下,这里是 make 的完整输出:
nvcc -Xcompiler -fPIC -dc -o /home/wvn/dirs/projects/sharc/build/../lib/mat33.o /home/wvn/dirs/projects/sharc/build/../src/mat33.cpp -I/home/wvn/dirs/projects/sharc/build/../src -I/home/wvn/dirs/projects/sharc/build/../kernel
nvcc -Xcompiler -fPIC -dc -o /home/wvn/dirs/projects/sharc/build/../lib/vec.o /home/wvn/dirs/projects/sharc/build/../src/vec.cpp -I/home/wvn/dirs/projects/sharc/build/../src -I/home/wvn/dirs/projects/sharc/build/../kernel
nvcc -Xcompiler -fPIC -dc -o /home/wvn/dirs/projects/sharc/build/../lib/sharc.o /home/wvn/dirs/projects/sharc/build/../src/sharc.cpp -I/home/wvn/dirs/projects/sharc/build/../src -I/home/wvn/dirs/projects/sharc/build/../kernel
nvcc -Xcompiler -fPIC -dc -o /home/wvn/dirs/projects/sharc/build/../lib/boundingbox.o /home/wvn/dirs/projects/sharc/build/../src/boundingbox.cpp -I/home/wvn/dirs/projects/sharc/build/../src -I/home/wvn/dirs/projects/sharc/build/../kernel
nvcc -Xcompiler -fPIC --shared /home/wvn/dirs/projects/sharc/build/../lib/mat33.o /home/wvn/dirs/projects/sharc/build/../lib/vec.o /home/wvn/dirs/projects/sharc/build/../lib/sharc.o /home/wvn/dirs/projects/sharc/build/../lib/boundingbox.o /home/wvn/dirs/projects/sharc/build/../kernel/gpu_rdr.cu -o /home/wvn/dirs/projects/sharc/build/../lib/libcurdr.so -I/home/wvn/dirs/projects/sharc/build/../src -I/home/wvn/dirs/projects/sharc/build/../kernel
ptxas fatal : Unresolved extern function '_ZN3vecC1Eddd'
makefile:32: recipe for target '/home/wvn/dirs/projects/sharc/build/../lib/libcurdr.so' failed
make: *** [/home/wvn/dirs/projects/sharc/build/../lib/libcurdr.so] Error 255
最佳答案
指的是更新后的帖子,而不是原始帖子。
如评论中所述,当您编译以 .cpp
结尾但包含 CUDA 构造或设备的文件时,需要做的事情之一是添加 -x cu
代码。您已经将其添加到适当的位置。
您围绕 COMMON
宏的讨论与此无关。它们有不同的用途。该宏不能替代 -x cu
。
另一件遗漏的事情是您需要在静态库生成点指示 nvcc
需要可重定位设备代码和设备链接。您可以通过将 -rdc=true
添加到编译命令行来执行此操作。您的 Makefile
可以这样修改:
lib: class
nvcc -Xcompiler -fPIC -rdc=true --lib myclass.o kernel.cu -o libhelpme.a -I.
这是必需的,因为您在一个编译单元 (kernel.cu
) 中有设备代码,它正在调用另一个编译单元 (myclass.cpp
) 中的设备代码。
有了这个改变,你更新后的帖子/项目对我来说编译没有问题,运行也没有错误。
$ make clean
rm *.o *.a program
$ make
nvcc -Xcompiler -fPIC -x cu -c -dc -o myclass.o myclass.cpp
nvcc -Xcompiler -fPIC -rdc=true --lib myclass.o kernel.cu -o libhelpme.a -I.
nvcc -o program main.cc -I. -L. -lhelpme
$ cuda-memcheck ./program
========= CUDA-MEMCHECK
hello world
hello from wrapper
x = 4
x = 3
========= ERROR SUMMARY: 0 errors
$
关于c++ - 如何编译依赖于 C++ 目标文件的 CUDA 共享库?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59493096/
我创建了一个基于命令行可移植脚本的工业化不可知构建系统,可用于快速构建多个依赖项目,而不必依赖特定的 IDE 或构建工厂。它是不可知的,因为它不是基于单个构建引擎。我使用 cmake 创建了第一个版本
我最初使用 Java 目标开发了一个语法(用于 TestRig 支持),然后将其移植到 Python(从 git hub 语法存储库扩展了 Python3 语法,因此需要将操作移植到 Python
我有一个以 iPhone 和 watchOS 为目标的 Xcode 项目。 iPhone 目标使用加速度计,模拟器不支持。我可以只启动 iPhone 应用程序而不启动 watch 目标吗?我从: Ca
您好,我想创建一个批处理文件,用于在 .eml 文件(目标 A)中查找某些关键字,然后删除它们所在的行。之后,我需要批处理文件将"new"文件放入(目标 B)中的单独 .eml 文件中。文件也可以是
当尝试通过 IntelliJ 运行示例 CorDapp (GitHub CorDapp) 时,我收到以下错误: Cannot inline bytecode built with JVM target
我在尝试向我的 kotlin spring 项目添加一些依赖项时遇到问题。我使用 spring boot 初始化程序来运行一个基本项目。 我的问题:如果我取消对 jackson 或 Koin 依赖项的
这是有问题的网站: http://www.onepixelroom.com/londonrefurb 当我点击关于部分后面的多个圆圈时,我希望它更改上面文本中的引号。 到目前为止,我得到它来显示 文本
单击后,我将删除两个元素 $(this) 和 $("#foo")。 目前我的代码如下所示: $(this).remove(); $("#foo").remove(); 如何在不重复自己的情况下优化它?
我有一个小脚本,可将 Markdown 文件编译为 html,并将其与一些样式表和 javascript 一起插入到模板的主体中。我有一个 GNU makefile 来完成这个: output.htm
已关闭。此问题需要 debugging details 。目前不接受答案。 编辑问题以包含 desired behavior, a specific problem or error, and the
一些背景知识: 在android中我们开发了同样的应用,基本上我们先开发了Android应用,现在我们创建了它的IOS版本,所以这个应用有多个客户端。在 android 中,我们实际上是使用 Andr
我想知道是否可以使用 knockout 来更改html中的目标() 我的所有其他信息都在 JavaScript 中,所以这对我来说是一个大问题。这是我的 JavaScript: var library
这个问题在这里已经有了答案: Selecting and manipulating CSS pseudo-elements such as ::before and ::after using j
我在我的有向图中添加了一堆节点和顶点,使用设置 typedef boost::adjacency_list graph; 创建 Node有一个节点名称字符串,Edge它的分数有一个整数。我试图遍历所有
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎与 help center 中定义的范围内的编程无关。 . 关闭 8 年前。 Improve
如何存储我在 NSUserDefaults 中创建的 Goal 类型的对象数组? ( swift ) 代码如下: func saveGoalList ( newGoalList : [Goal] ){
Array.prototype.indexOf 和 Date.now 已在 ES5 中引入。如果我编译存储在文件 test.ts 中的以下代码,为什么 Typescript 不能转译? Date.no
我正在阅读有关属性的内容,并了解到可以使用您的代码将它们应用于不同的目标实体 -(请参阅 Attribute Targets)。 因此,查看我项目中的 AssemblyInfo.cs 文件,我可以看到
给定一个 Makefile: all: build/a build/b build/c # need to change this to all: build/* build/a:
我有一个带有多框架目标的项目- netstandard2.0;net471 . 我想为 netframework 构建解决方案和 netstandard分别。 目前我使用这个 MSBuild 命令:
我是一名优秀的程序员,十分优秀!