- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我对 OpenCL 有一个问题,就是它执行了整个命令队列,但它只读取输入的 1/4,只写入结果的 1/4。无论迭代多少次,总是 1/4。
而且它有时会随机崩溃..调试时我没有得到任何信息,因为没有调试符号,它崩溃的地方(0x4c4783f6 in ????等)
源代码:
#include <iostream>
#include <cl/cl.h>
#include <cassert>
#include <cstring>
const char *progsrc[] = {
"#pragma OPENCL EXTENSION cl_intel_printf : enable\n\
__kernel void add(__global const int *a, __global const int *b, __global int *out) \
{ \
int tid = get_global_id(0);\
out[tid] = tid/*a[tid]+b[tid]*/;\
printf(\"krnl: %d = %d + %d \\n\", out[tid], a[tid], b[tid]);\
}"};
const int iterations = 20;
#define CLCheck(a) \
do\
{\
if(a != CL_SUCCESS)\
{\
std::cerr << "OpenCL Error(" << a << ") at " << __LINE__ << std::endl;\
return -1;\
}\
} while(0)
int main()
{
cl_int err = CL_SUCCESS;
int *aH = NULL;
int *bH = NULL;
int *outH = NULL;
cl_uint platnum, devnum;
cl_device_id dev;
cl_platform_id plat;
err = clGetPlatformIDs(0, 0, &platnum);
CLCheck(err);
cl_platform_id pfids[platnum];
err = clGetPlatformIDs(platnum, pfids, &platnum);
CLCheck(err);
if(!platnum)
{
std::cerr << "No platform found." << std::endl;
return -1;
}
else
std::cout << platnum << " OpenCL platform(s) found.\n" << std::endl;
for(unsigned int i = 0; i != platnum; i++)
{
char buf[4096];
err = clGetDeviceIDs(pfids[i], CL_DEVICE_TYPE_ALL, 0, 0, &devnum);
CLCheck(err);
cl_device_id devids[devnum];
err = clGetDeviceIDs(pfids[i], CL_DEVICE_TYPE_ALL, devnum, devids, &devnum);
CLCheck(err);
if(!devnum)
{
std::cerr << "No device found." << std::endl;
return -1;
}
else
std::cout << " " << devnum << " OpenCL device(s) found.\n" << std::endl;
for(unsigned int i2 = 0; i2 != devnum; i2++)
{
char buf[1024];
std::cout << ": \n\tName: " << buf;
err = clGetDeviceInfo(devids[i2], CL_DEVICE_VENDOR, 1024, buf, NULL);
CLCheck(err);
if(!strncmp(buf, "Intel", 5))
{
dev = devids[0];
plat = pfids[i];
std::cout << "\n\tFound Intel(R) OpenCL device.";
}
}
}
cl_context_properties ctxprop[3] = { CL_CONTEXT_PLATFORM, (cl_context_properties)plat, 0};
cl_context ctx = clCreateContext(ctxprop, 1, &dev, NULL, NULL, &err);
CLCheck(err);
cl_program program = clCreateProgramWithSource(ctx, 1, progsrc, NULL, &err);
CLCheck(err);
err = clBuildProgram(program, 1, &dev, "", NULL, NULL);
if(err != CL_SUCCESS)
{
size_t bufsz;
err = clGetProgramBuildInfo(program, dev, CL_PROGRAM_BUILD_LOG, 0, 0, &bufsz);
char buf[bufsz];
err = clGetProgramBuildInfo(program, dev, CL_PROGRAM_BUILD_LOG, bufsz, buf, &bufsz);
std::cerr << "OpenCL program building failed: " << buf << std::endl;
return -1;
}
err = clUnloadCompiler();
CLCheck(err);
aH = new int[iterations];
bH = new int[iterations];
outH = new int[iterations];
memset(outH, 0, iterations*sizeof(int));
for(int i = 0; i != iterations; i++)
{
aH[i] = i;
bH[i] = i*2;
}
cl_mem aCL = clCreateBuffer(ctx, CL_MEM_READ_ONLY, iterations, NULL, &err);
cl_mem bCL = clCreateBuffer(ctx, CL_MEM_READ_ONLY, iterations, NULL, &err);
CLCheck(err);
cl_mem outCL = clCreateBuffer(ctx, CL_MEM_WRITE_ONLY, iterations, NULL, &err);
CLCheck(err);
cl_kernel krnl = clCreateKernel(program, "add", &err);
CLCheck(err);
err = clSetKernelArg(krnl, 0, sizeof(aCL), &aCL);
CLCheck(err);
err = clSetKernelArg(krnl, 1, sizeof(bCL), &bCL);
CLCheck(err);
err = clSetKernelArg(krnl, 2, sizeof(outCL), &outCL);
CLCheck(err);
cl_command_queue cmdqueue = clCreateCommandQueue(ctx, dev, 0, &err);
cl_event evt;
size_t global_work_size[1] = { iterations };
err = clEnqueueWriteBuffer(cmdqueue, aCL, CL_TRUE, 0, iterations, aH, 0, NULL, NULL);
err = clEnqueueWriteBuffer(cmdqueue, bCL, CL_TRUE, 0, iterations, bH, 0, NULL, NULL);
err = clEnqueueNDRangeKernel(cmdqueue, krnl, 1, NULL, global_work_size, NULL, 0, NULL, &evt);
err = clWaitForEvents(1, &evt);
err = clEnqueueReadBuffer(cmdqueue, outCL, CL_TRUE, 0, iterations, outH, 0, NULL, &evt);
for(int i = 0; i != iterations; i++)
{
std::cout << outH[i] << std::endl;
}
err = clReleaseEvent(evt);
err = clReleaseCommandQueue(cmdqueue);
err = clReleaseKernel(krnl);
err = clReleaseMemObject(outCL);
err = clReleaseMemObject(bCL);
err = clReleaseMemObject(aCL);
err = clReleaseProgram(program);
err = clReleaseContext(ctx);
if(aH)
delete aH;
if(bH)
delete bH;
if(outH)
delete outH;
return 0;
}
输出:
2 OpenCL platform(s) found.
Platform 0 :
Name: NVIDIA CUDA
Vendor: NVIDIA Corporation
Profile: FULL_PROFILE
Version: OpenCL 1.1 CUDA 4.0.1
Extensions: cl_khr_byte_addressable_store cl_khr_icd cl_khr_gl_sharing c
l_nv_d3d9_sharing cl_nv_d3d10_sharing cl_khr_d3d10_sharing cl_nv_d3d11_sharing c
l_nv_compiler_options cl_nv_device_attribute_query cl_nv_pragma_unroll
1 OpenCL device(s) found.
Device 0:
Name: GeForce GT 425M
Vendor: NVIDIA Corporation
Profile: FULL_PROFILE
Driver version: 280.26
OpenCL version: OpenCL C 1.1
Version: OpenCL 1.1 CUDA
Extensions: cl_khr_byte_addressable_store cl_khr_icd cl_khr_gl_sharing c
l_nv_d3d9_sharing cl_nv_d3d10_sharing cl_khr_d3d10_sharing cl_nv_d3d11_sharing c
l_nv_compiler_options cl_nv_device_attribute_query cl_nv_pragma_unroll cl_khr_g
lobal_int32_base_atomics cl_khr_global_int32_extended_atomics cl_khr_local_int32
_base_atomics cl_khr_local_int32_extended_atomics cl_khr_fp64
Platform 1 :
Name: Intel(R) OpenCL
Vendor: Intel(R) Corporation
Profile: FULL_PROFILE
Version: OpenCL 1.1
Extensions: cl_khr_fp64 cl_khr_global_int32_base_atomics cl_khr_global_i
nt32_extended_atomics cl_khr_local_int32_base_atomics cl_khr_local_int32_extende
d_atomics cl_khr_byte_addressable_store cl_intel_printf cl_ext_device_fission cl
_intel_immediate_execution cl_khr_gl_sharing cl_khr_icd
1 OpenCL device(s) found.
Device 0:
Name: Intel(R) Core(TM) i3 CPU M 370 @ 2.40GHz
Found Intel(R) OpenCL device.
Vendor: Intel(R) Corporation
Profile: FULL_PROFILE
Driver version: 1.1
OpenCL version: OpenCL C 1.1
Version: OpenCL 1.1 (Build 15293.6650)
Extensions: cl_khr_fp64 cl_khr_global_int32_base_atomics cl_khr_global_i
nt32_extended_atomics cl_khr_local_int32_base_atomics cl_khr_local_int32_extende
d_atomics cl_khr_byte_addressable_store cl_intel_printf cl_ext_device_fission cl
_intel_immediate_execution cl_khr_gl_sharing
krnl: 0 = 0 + 0
krnl: 1 = 1 + 2
krnl: 2 = 2 + 4
krnl: 3 = 3 + 6
krnl: 4 = 4 + 8
krnl: 5 = 0 + 0
krnl: 6 = 0 + 0
krnl: 7 = 0 + 0
krnl: 16 = 0 + 492859489
krnl: 17 = 0 + -1042621749
krnl: 18 = 0 + 1310105771
krnl: 19 = 0 + 134230852
krnl: 8 = 0 + 0
krnl: 9 = 0 + 0
krnl: 10 = 0 + -1094462526
krnl: 11 = 0 + -1094462526
krnl: 12 = 0 + -1230120245
krnl: 13 = 0 + 500723958
krnl: 14 = 0 + 530164160
krnl: 15 = 0 + 492859489
0
1
2
3
4
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
谢谢:)
最佳答案
我不熟悉 openCL,但我认为您在这里遗漏了一些 sizeof
:
err = clEnqueueWriteBuffer(cmdqueue, aCL, CL_TRUE, 0, iterations, aH, 0, NULL, NULL);
应该是:
err = clEnqueueWriteBuffer(cmdqueue, aCL, CL_TRUE, 0, iterations * sizeof(int), aH, 0, NULL, NULL);
同样适用于此之后的类似代码。
编辑:
还有一个地方你可能错过了一些 sizeof()
:
cl_mem aCL = clCreateBuffer(ctx, CL_MEM_READ_ONLY, iterations, NULL, &err);
cl_mem bCL = clCreateBuffer(ctx, CL_MEM_READ_ONLY, iterations, NULL, &err);
CLCheck(err);
cl_mem outCL = clCreateBuffer(ctx, CL_MEM_WRITE_ONLY, iterations, NULL, &err);
CLCheck(err);
关于c++ - OpenCL 仅读取/写入缓冲内存的 1/4,有时会崩溃,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7627808/
我有一段代码看起来像这样: void update_clock(uint8_t *time_array) { time_t time = *((time_t *) &time_array[0]
应用程序崩溃了 :( 请帮助我.. 在这方面失败了。我找不到错误?该应用程序可以连接到 iTunesConnect 但它会出错。 谁能根据下面的崩溃报告判断问题出在哪里? share_with_app
小二是新来的实习生,作为技术 leader,我给他安排了一个非常简单的练手任务,把前端 markdown 编辑器里上传的图片保存到服务器端,结果他真的就把图片直接保存到了服务器上,这下可把我气坏了,就
我正在创建一个函数,它将目录路径作为参数传递,或者如果它留空,则提示用户输入。 我已经设置了我的 PATH_MAX=100 和 if 语句来检查 if ((strlen(folder path) +
我已将“arial.ttf”文件(从我的/Windows/Fonts 文件夹中获取)加载到内存中,但是将其传递到 FT_New_Memory_Face 时会崩溃(在 FT_Open_Face 中的某处
我正在尝试在我的计算机上的两个控制台之间进行 rtsp 流。 在控制台 1 上,我有: ffmpeg -rtbufsize 100M -re -f dshow -s 320x240 -i video=
我正在尝试使用 scio_beast在一个项目中。我知道它还没有完成,但这并不重要。我已经设法让它工作得很好。 我现在正在尝试连接到 CloudFlare 后面的服务器,我知道我需要 SNI 才能工作
我有一个带有关联宏的下拉列表,如下所示: Sub Drop() If Range("Hidden1!A1") = "1" Then Sheets("Sheet1").Se
我对 bash 很陌生。我要做的就是运行这个nvvp -vm /usr/lib64/jvm/jre-1.8.0/bin/java无需记住最后的路径。我认为 instafix 就是这样做...... n
我在 Windows 上使用 XAMPP 已经两年左右了,它运行完美,没有崩溃没有问题。 (直到四个月前。) 大约四个月前,我们将服务器/系统升级到了更快的规范。 这是旧规范的内容 - Windows
我面临着一个非常烦人的 android 崩溃,它发生在大约 1% 的 PRODUCTION session 中,应用程序始终在后台运行。 Fatal Exception: android.app.Re
尝试使用下面的函数: public void createObjectType() { try { mCloudDB.createObjectType(ObjectTypeIn
由于我正在进行的一个项目,我在 CF11 管理员中弄乱了类路径,我设法使服务器崩溃,以至于我唯一得到的是一个漂亮的蓝屏和 500 错误.我已经检查了日志,我会把我能做的贴在帖子的底部,但我希望有人会启
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 10 个月前关闭。 Improve
我最近从 xcode 3.x 更新到 4.2,当我在 4.2 中运行应用程序时,我遇到了核心数据问题。我还更新到了 iOS 5,所以问题可能就在那里,我不太确定。 这些应用程序在 3.x 中运行良好,
我是一个相对较新的 iPhone 应用程序开发人员,所以我的知识有点粗略,所以如果这是一个微不足道的问题,请原谅我。 我有一个导航应用程序,它通过在navigationController对象上调用p
if ([MFMailComposeViewController canSendMail]) { MFMailComposeViewController *mailViewController
你能帮我吗? 我正在设置 UILocalNotification,当我尝试设置其 userInfo 字典时,它崩溃了。 fetchedObjects 包含 88 个对象。 这是代码: NSDi
为什么我的代码中突然出现 NSFastEnumeration Mutation Handler 崩溃。我很茫然为什么会突然出现这个崩溃以及如何解决它。 最佳答案 崩溃错误: **** 由于未捕获的异常
当我从表中删除行时,我的应用程序崩溃了。这是我检测到错误和堆栈跟踪的来源。谢谢! //delete row from database - (void)tableView:(UITableView *
我是一名优秀的程序员,十分优秀!