- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我是 CUDA 的新手,我想使用 cudaHostAlloc
。我能够将我的问题隔离到以下代码。使用 malloc
进行主机分配工作,使用 cudaHostAlloc
导致段错误,可能是因为分配的区域无效?当我在这两种情况下转储指针时,它都不是空的,所以 cudaHostAlloc
返回一些东西......
作品
in_h = (int*) malloc(length*sizeof(int)); //works
for (int i = 0;i<length;i++)
in_h[i]=2;
没用
cudaHostAlloc((void**)&in_h,length*sizeof(int),cudaHostAllocDefault);
for (int i = 0;i<length;i++)
in_h[i]=2; //segfaults
独立代码
#include <stdio.h>
void checkDevice()
{
cudaDeviceProp info;
int deviceName;
cudaGetDevice(&deviceName);
cudaGetDeviceProperties(&info,deviceName);
if (!info.deviceOverlap)
{
printf("Compute device can't use streams and should be discarded.");
exit(EXIT_FAILURE);
}
}
int main()
{
checkDevice();
int *in_h;
const int length = 10000;
cudaHostAlloc((void**)&in_h,length*sizeof(int),cudaHostAllocDefault);
printf("segfault comming %d\n",in_h);
for (int i = 0;i<length;i++)
{
in_h[i]=2; // Segfaults here
}
return EXIT_SUCCESS;
}
~
调用
[id129]$ nvcc fun.cu
[id129]$ ./a.out
segfault comming 327641824
Segmentation fault (core dumped)
详情
程序在集群上以交互模式运行。有人告诉我,从计算节点调用程序会将其推送到集群。其他自制玩具 cuda 代码没有遇到任何问题。
编辑
cudaError_t err = cudaHostAlloc((void**)&in_h,length*sizeof(int),cudaHostAllocDefault);
printf("Error status is %s\n",cudaGetErrorString(err));
给出驱动程序错误...
Error status is CUDA driver version is insufficient for CUDA runtime version
最佳答案
始终检查错误。 cudaHostAlloc
可能无法分配任何内存。如果它失败了,你不是在逃避,而是在写入未分配的地址空间。使用 malloc
时,它会根据请求分配内存并且不会失败。但也有 malloc 也可能导致失败的情况,因此最好在写入指针之前对指针进行检查。
为了将来,最好做这样的事情
int *ptr = NULL;
// Allocate using cudaHostAlloc or malloc
// If using cudaHostAlloc check for success
if (!ptr) ERROR_OUT();
// Write to this memory
EDIT(对问题中编辑的回应)
错误消息表明与工具包相比,您的驱动程序较旧。如果您不想暂时卡住,请尝试下载与您的驱动程序兼容的旧版本 cuda 工具包。您可以将它安装在您的用户帐户中并暂时使用它的 nvcc + 库。
关于c - malloc 有效,cudaHostAlloc 段错误?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13594205/
我是 C 的新手,在 Linux 中使用带有开关 gcc -g -std=c89 -Wall ... 的 gcc4.4.6 进行编程,我在许多函数深处遇到了这个错误我的程序名为 compute: **
今天阅读Rust subreddit时,我发现以下评论: jemalloc针对(多线程)速度而不是内存使用进行了优化 经过更多研究后,我发现还有更多选择(例如calloc)。 我想了解不同内存分配器的
相关代码: write(-1, "test", sizeof("test")); void * p = malloc(1024); void * p2 = malloc(510); w
我正在比较不同的 malloc 实现,我想比较它们的运行时间和内存使用情况。 特别是,我对运行时和最大常驻内存感兴趣。重要的是最大常驻内存将是真实的(没有代码段等)。 我不能使用像 valgrind
我承认这三个都有不同的含义。但是,我不明白这些具体情况适用于哪些特定情况。任何人都可以分享每个例子吗?谢谢。 malloc(sizeof(int)) malloc(size
GLib 文档推荐使用 GLib Slice Allocator 而不是 malloc: "For newly written code it is recommended to use the ne
我正在分配一个字符串 int main(){ int buf = 1024; char *input = malloc(sizeof(char*) * buf); //CODE
Here有一个关于 malloc 包的环境变量列表: MallocStackLogging MallocStackLoggingNoCompact MallocPreScribble MallocSc
总体问题:当您将通过malloc分配的返回值分配给一个指针时,您是否需要malloc该指针以及,还是您可以简单地声明并分配它? 例如,假设我有一个函数 foo,它在执行过程中使用 malloc 创建了
这个问题在这里已经有了答案: String assignment in C (4 个答案) 关闭 7 年前。 这是有问题的片段。 int main() { char** RESERV = (
任务是将一个二进制文件解析到内存中。但是,我事先不知道需要分配的内存量。 哪种方法更可取:在解析例程中进行多个小 malloc,或者首先遍历文件以确定所需的内存量,然后再次解析? 感谢任何提示。 最佳
我最近一直在尝试理解严格别名的一个特定方面,我认为我已经制作了尽可能最小的有趣代码。 (对我来说很有趣,就是这样!) 更新:根据到目前为止的答案,很明显我需要澄清这个问题。从某个角度来看,这里的第一个
我一直在为我创建的一个简单程序创建测试。我总是使用类似这样的方法检查使用 malloc 分配内存是否失败 int* ptr = malloc(sizeof(int) * x); if(!ptr){
我是 malloc 和对齐 malloc 的新手。我知道如何使用它们。但是,我不知道在什么情况下我们应该使用对齐的 malloc 而不是标准的 malloc。你能给我解释一下吗? 最佳答案 glibc
这样分配内存是不好的做法吗?: FOO *foo; while (!(foo = malloc(sizeof(FOO)))) ; 最佳答案 我不知道有什么不好的做法,但这种情况并不常见。 malloc
有人可以向我解释使用和不使用 malloc 创建结构之间的区别吗?什么时候应该使用 malloc,什么时候应该使用常规初始化? 例如: struct person { char* name;
假设我有一个类型 node_t typedef struct node{ char* value; struct node *next; }node_t; 当我想创建一个名为 n1 的
关闭。这个问题需要更多 focused .它目前不接受答案。 想改进这个问题?更新问题,使其仅关注一个问题 editing this post . 3年前关闭。 Improve this questi
我对指针感到困惑。这是交换两个名称的代码。请看代码。考虑输入:hellohai(对于 d)和 asd(对于 e)。我得到的输出:asd 1ellohai 1ellohai #include #incl
我已经编写了这个函数(如下)。它应该逐行读取文件。编辑该行并将某些单词/字符放入各种功能中。然后将这些函数放入“entrant”结构的数组(malloc)中。 问题是,当我退出循环并尝试打印数组时,放
我是一名优秀的程序员,十分优秀!