cuda - 使用 CUDA 模块构建 GPL C 程序-6ren

cuda - 使用 CUDA 模块构建 GPL C 程序

转载作者：行者123 更新时间：2023-12-04 00:45:03

24

4

我正在尝试修改用 C 编写的 GPL 程序。我的目标是用 CUDA 实现替换一种方法，这意味着我需要使用 nvcc 而不是 gcc 进行编译。我需要帮助构建项目 - 不实现它(你不需要知道任何关于 CUDA C 的帮助，我不认为)。

这是我第一次尝试更改涉及 .configure 和 Makefile 的中等复杂度的 C 项目。老实说，这是我很长时间以来第一次在 C 中做任何事情，包括任何涉及 gcc 或 g++ 的事情，所以我很迷茫。

我对学习配置和 Makefile 不是很感兴趣——这更像是一个实验。在花时间创建正确的构建脚本之前，我想看看项目实现是否顺利。 (不是不愿意根据需要学习，只是想给出一个范围的想法)。

话虽如此，我有什么选择来构建这个项目？我有无数的问题...

我尝试在 AC_PROG_CC 之后将“CC=nvcc”添加到 configure.in 文件中。这似乎可行 - 运行 configure 和 make 的输出显示 nvcc 作为编译器。但是 make 无法使用 CUDA 内核编译源文件，无法识别 CUDA 特定的语法。我不知道为什么，希望这会奏效。

是否可以使用 nvcc 编译源文件，然后在主程序的 make 过程中的链接步骤中包含它？如果是这样，怎么做？ (这个问题可能没有意义——我对此真的很生疏)

这样做的正确方法是什么？

有没有一种快速而肮脏的方法可以用于测试目的？

每个人都使用一些 secret 工具来设置和理解这些配置和 Makefile 吗？这比我习惯的 Apache Ant 脚本还要糟糕(是的，我不在我的领域)

最佳答案

您不需要使用 nvcc 编译所有内容。您猜测您可以使用 NVCC 编译您的 CUDA 代码并保留其他所有内容(链接除外)是正确的。这是我开始使用的方法。

添加 1 个新 header (例如 myCudaImplementation.h)和 1 个新源文件(扩展名为 .cu，例如 myCudaImplementation.cu)。源文件包含您的内核实现以及(主机)C 包装函数，该函数使用适当的执行配置(又名 <<<>>>)和参数调用内核。头文件包含 C 包装函数的原型(prototype)。让我们调用这个包装函数 runCudaImplementation()

我还将在源文件中提供另一个主机 C 函数(在 header 中带有原型(prototype))，该函数查询和配置存在的 GPU 设备，如果成功则返回 true，否则返回 false。我们称这个函数为 configureCudaDevice() .

现在，在您通常调用 CPU 实现的原始 C 代码中，您可以执行此操作。

// must include your new header
#include "myCudaImplementation.h"

// at app initialization
// store this variable somewhere you can access it later
bool deviceConfigured = configureCudaDevice;          
...                             
// then later, at run time
if (deviceConfigured) 
    runCudaImplementation();
else
    runCpuImplementation(); // run the original code

现在，由于您将所有 CUDA 代码放在一个新的 .cu 文件中，您只需使用 nvcc 编译该文件。其他一切都保持不变，除了您必须链接到 nvcc 输出的目标文件。例如

nvcc -c -o myCudaImplementation.o myCudaImplementation.cu <other necessary arguments>

然后将 myCudaImplementation.o 添加到您的链接行(类似于:)
g++ -o myApp myCudaImplementation.o

现在，如果您有一个使用 configure 的复杂应用程序要使用并且已经有一个复杂的 makefile，那么它可能比上述涉及更多，但这是一般方法。底线是您不想用 nvcc 编译所有源文件，只需要 .cu 文件。将您的主机编译器用于其他所有内容。

我不是配置专家，因此无法真正提供帮助。您可以运行 configure 来生成一个 makefile，然后编辑该 makefile——这不是一个通用的解决方案，但它会让你开始。

请注意，在某些情况下，您可能还需要单独编译 .cu文件从链接它们。在这种情况下，您需要使用 NVCC 的单独编译和链接功能， this blog post might be helpful .

关于cuda - 使用 CUDA 模块构建 GPL C 程序，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/9363827/

24

4

0

文章推荐： function - 为什么要让全局 Lua 函数本地化？

文章推荐： reactjs - 使用 mui-datatable 动态添加新列

文章推荐： visual-studio-2010 - 在 Visual Studio 中批量标准化行尾

文章推荐： sms - 如何在 SMS 状态从 'Queued' 更改为 'Sent' 时收到通知？

C 程序我想知道是否有办法简化我的 dayofyear 程序？
我是 C 语言新手，我编写了这个 C 程序，让用户输入一年中的某一天，作为返回，程序将输出月份以及该月的哪一天。该程序运行良好，但我现在想简化该程序。我知道我需要一个循环，但我不知道如何去做。这是程序
java - GUI Java 程序 - Paint 程序
我一直在努力找出我的代码有什么问题。这个想法是创建一个小的画图程序，并有红色、绿色、蓝色和清除按钮。我有我能想到的一切让它工作，但无法弄清楚代码有什么问题。程序打开，然后立即关闭。 import ja
homebrew - 从 Homebrew 程序/欺骗程序到 Homebrew 程序/核心的迁移是什么？
我想安装screen，但是接下来我应该做什么？ $ brew search screen imgur-screenshot screen
python - 客户端(python 程序)没有收到服务器(c 程序)返回的响应？
我有一个在服务器端工作的 UDP 套接字应用程序。为了测试服务器端，我编写了一个简单的 python 客户端程序，它发送消息“hello world how are you”。服务器随后应接收消息，将
python - 运行一个 shell 脚本，该脚本运行一个 python 程序，然后运行一个 R 程序
我有一个 shell 脚本，它运行一个 Python 程序来预处理一些数据，然后运行一个 R 程序来执行一些长时间运行的任务。我正在学习使用 Docker 并且我一直在运行 FROM r-base:l
python - 在 Linux 中从 Python 启动一个 c 程序，将一个大文本字符串作为参数传递给 c 程序
在 Linux 中。我有一个 c 程序，它读取一个 2048 字节的文本文件作为输入。我想从 Python 脚本启动 c 程序。我希望 Python 脚本将文本字符串作为参数传递给 c 程序，而不是将
VHDL 程序
对于一个类，我被要求编写一个 VHDL 程序，该程序接受两个整数输入 A 和 B，并用 A+B 替换 A，用 A-B 替换 B。我编写了以下程序和测试平台。它完成了实现和行为语法检查，但它不会模拟。尽
haskell 程序
module Algorithm where import System.Random import Data.Maybe import Data.List type Atom = String ty
求给定N个数的最小公倍数的C++程序
我想找到两个以上数字的最小公倍数求给定N个数的最小公倍数的C++程序最佳答案 int lcm(int a, int b) { return (a/gcd(a,b))*b; } 对于gcd，请查看
索引器的c#程序
这个程序有错误。谁能解决这个问题？ Error is :TempRecord already defines a member called 'this' with the same paramete
铁路围栏密码的C++程序
当我运行下面的程序时，我在 str1 和 str2 中得到了垃圾值。所以 #include #include #include using namespace std; int main() {
死兔子的C++程序
这是我的作业: 一对刚出生的兔子(一公一母)被放在田里。兔子在一个月大时可以交配，因此在第二个月的月底，每对兔子都会生出两对新兔子，然后死去。注:在第0个月，有0对兔子。第 1 个月，有 1 对兔子
十进制转十六进制的C++程序
我编写了一个程序，通过对字母使用 switch 命令将十进制字符串转换为十六进制，但是如果我使用 char，该程序无法正常工作!没有 switch 我无法处理 9 以上的数字。我希望你能理解我，因为我
连接MySQL的C++程序
我是 C++ 新手(虽然我有一些 C 语言经验)和 MySQL，我正在尝试制作一个从 MySQL 读取数据库的程序，我一直在关注这个 tutorial但当我尝试“构建”解决方案时出现错误。 (我正在使
Swift If 程序
仍然是一个初学者，只是尝试使用 swift 中的一些基本函数。有人能告诉我这段代码有什么问题吗？ import UIKit var guessInt: Int var randomNum = arc
折叠常量的C++程序
我正在用 C++11 编写一个函数，它采用 constant1 + constant2 形式的表达式并将它们折叠起来。 constant1 和 constant2 存储在 std::string 中，
2个矩阵相加和相乘的C++程序
我用 C++ 编写了这段代码，使用运算符重载对 2 个矩阵进行加法和乘法运算。当我执行代码时，它会在第 57 行和第 59 行产生错误，非法结构操作(两行都出现相同的错误)。请解释我的错误。提前致谢:
交换字符串中两个字符的C++程序
我是 C++ 的初学者，我想编写一个简单的程序来交换字符串中的两个字符。例如；我们输入这个字符串:“EXAMPLE”，我们给它交换这两个字符:“E”和“A”，输出应该类似于“AXEMPLA”。我在
确定三角形的C++程序
我需要以下代码的帮助: 声明 3 个 double 类型变量，每个代表三角形的三个边中的一个。提示用户为第一面输入一个值，然后将用户的输入设置为您创建的代表三角形第一条边的变量。将最后 2 个步
矩阵旋转的c++程序
我是新来的，如果问题不好请见谅任务:将给定矩阵旋转180度输入: 1 4 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 输出: 16 15 14 13 12 11

首页

博学

6Ren·AI

商城

cuda - 使用 CUDA 模块构建 GPL C 程序