c++ - OpenCL - 我的数组怎么会太大而导致堆栈溢出？-6ren

c++ - OpenCL - 我的数组怎么会太大而导致堆栈溢出？

转载作者：行者123 更新时间：2023-11-30 01:49:55

25

4

我是 OpenCL 的新手，我正在使用 C++ 包装器对其进行编程。我有一张较旧的 AMD 卡 (Radeon HD 5770)，这可能是问题的原因，但我想暂时排除这个问题。

我正在尝试“处理”一个“图像”，为此我将 400 x 400 像素 ^2 伪造为一维整数数组。所以，我的缓冲区大小应该是 4 * 400 * 400 - 大约 640kb。我认为这根本不算大。

一些我认为相关的统计数据:

每个工作组的最大工作项数:256
我认为每个工作组的最大工作项尺寸:(256, 256, 256) 其中 x * y * z <= 256。
最大内存分配大小:536,870,912(看起来像 1/2 GB)
催化剂 14.12
AMD SDK 3.0.0(测试版)
使用 Visual Studio Community 2013

部分代码:

#include <cstdio>
#include <cstdlib>
#include <fstream>
#include <iostream>
#include <iterator>
#include <stdio.h>
#include <streambuf>
#include <string>

#include <CL/cl.hpp>

using namespace System;
using namespace std;
#define IMG_WIDTH 400
#define IMG_HEIGHT 400

int main(array<System::String ^> ^args)
{
    vector<cl::Platform> all_platforms;
    cl::Platform::get(&all_platforms);

    cl::Platform default_platform = all_platforms[0];

    vector<cl::Device> all_devices;
    default_platform.getDevices(CL_DEVICE_TYPE_ALL, &all_devices);
    cl::Device default_device = all_devices[0];     

    cl::Context context({ default_device });

    std::ifstream file("kernels.cl");
    std::string kcode(std::istreambuf_iterator<char>(file),
                      (std::istreambuf_iterator<char>()));

    cl::Program::Sources sources(1,
         std::make_pair(kcode.c_str(), kcode.length() + 1));

    cl::Program program(context, sources);

    if (program.build({ default_device }) != CL_SUCCESS){
        cout << "Error building " << program.getBuildInfo<CL_PROGRAM_BUILD_LOG>(default_device) << endl;
    exit(1);
    }

    int h_C[IMG_WIDTH * IMG_HEIGHT]; // initialize the array.
    cl::Buffer d_C(context, CL_MEM_READ_WRITE, sizeof(int) * IMG_WIDTH * IMG_HEIGHT); // create the device memory for this array.

    cl::CommandQueue queue(context, default_device, CL_QUEUE_PROFILING_ENABLE);

    cl::Kernel kernel_to_run(program, "get_row");   
    kernel_to_run.setArg(0, d_C);
    kernel_to_run.setArg(1, IMG_WIDTH);
    kernel_to_run.setArg(2, IMG_HEIGHT);

    cl::Event evt;
    queue.enqueueNDRangeKernel(kernel_to_run, cl::NullRange, cl::NDRange(IMG_WIDTH, IMG_HEIGHT), cl::NDRange(10, 10), NULL, &evt);
    queue.finish();

    /* I think the problem is here. If I comment it out, the program
       will run fine, but I need the device information back to the
       host, though!
    */
    queue.enqueueReadBuffer(d_C, CL_TRUE, 0, sizeof(int) * IMG_WIDTH * IMG_HEIGHT, h_C);

    unsigned long elapsed = (unsigned long)(evt.getProfilingInfo<CL_PROFILING_COMMAND_END>() -
    evt.getProfilingInfo<CL_PROFILING_COMMAND_START>());
std::cout << " result: " << elapsed / (float)10e6 << " ms";

    queue.flush();
    queue.finish();
    delete &d_C;
}

内核，它只存储每个“像素”属于哪个全局行:

#pragma OPENCL EXTENSION cl_khr_byte_addressable_store : enable
__kernel void get_row(__global int *out, int width, int height){

    int r = get_global_id(1);
    int c = get_global_id(0);

    if ((r >= height) || (c >= width))
        return; 

    int gIdx = r * width + c;

    out[gIdx] = r;

}

我做错了什么？对于 400 x 400，程序给我一个错误“进程因堆栈溢出异常而终止”

我的“图像”尺寸是否对于整个工作项大小来说太大(仅 400 x 400)？
我选择的工作组大小为 100 (10 x 10)，因此，我认为我将有 1600 个工作组和 400 x 400。我认为工作组的数量没有限制，即使对于旧设备，还是有？
可能我的主机代码顺序不正确。

在此方面的任何帮助表示赞赏。如果可能的话，我不想买新的显卡。我不想将图像分割成更小的矩形，然后将它们分成工作组。

我在 CUDA(在另一台机器上)中对大于 400 x 400 的图像执行与上述相同的操作，没有问题。

最佳答案

您的变量 h_C 占用了大量堆栈内存。堆栈内存非常有限。而不是像这样使用堆栈变量，

int h_C[IMG_WIDTH * IMG_HEIGHT];

使用类似 std::vector 的方式动态分配它:

std::vector<int> h_C;
h_C.resize(IMG_WIDTH * IMG_HEIGHT);
...
queue.enqueueReadBuffer(d_C, CL_TRUE, 0, sizeof(int) * IMG_WIDTH * IMG_HEIGHT, h_C.data());

关于c++ - OpenCL - 我的数组怎么会太大而导致堆栈溢出？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28262984/

25

4

0

文章推荐： Android 调色板不起作用？

文章推荐： java - 如何设置JFreeChart.Histogram来对应数据

文章推荐： android - 未经 WRITE_EXTERNAL_STORAGE 许可将声音设置为铃声？

文章推荐： c++ - Openmp:无法正确计算并行 for 循环内的作业状态

vue.js - Nuxt vendor.app 太大，font awesome 太大
您好，我在我的项目中使用 Nuxt JS，我注意到我的 js 文件变得相当大我的问题是如何缩小或拆分超过 1mb 的 vendor 或 js 文件我还看到 font-awesome 也占用了很多空
github 不显示提交差异，太大
github 只是告诉我，而不是提交差异——关于我的一个提交—— Sorry, this diff is taking too long to generate. It may be too larg
flash - drawRect 太大
这个非常简单的绘图命令创建了一个 11x11 像素的跟踪红色矩形: _sp.graphics.lineStyle( 1, 0xFF0000, 1, true, LineScaleMode.NORMAL
macos - NSCombobox 太大
我正在尝试创建一个 Mac 应用程序。但是在我使用 Interface Builder 插入组合框并运行应用程序后，我收到以下消息: This application is trying to dra
php - 服务器上显示的请求 URI 太大
我通过 url 传递以下数据: '; echo 'Download PDF'; echo ''; ?> 这里$result包含数组形式的 RSS 提要数据。我正在使用 urlencode(
Javascript 相机快照拉伸(stretch)太大
我正在尝试通过 JavaScript 从某人的网络摄像头拍摄快照。该代码可以工作，只是生成的图像对我来说被拉伸(stretch)太多而难以阅读。我搞乱了:ctx.drawImage(video, 0
oop - 什么时候类(class)太大？
关闭。这个问题是opinion-based .它目前不接受答案。想改进这个问题？更新问题，以便 editing this post 可以用事实和引用来回答它. 3年前关闭。 Improve this
javascript - 索引包 block 太大
我是 React 和 Webpack 代码分割的新手，所以我不确定这对于捆绑 block 来说是否合适。我尝试根据路由 ( basically done the same thing as in t
java - 由于音频文件，APK 太大
我正在开发自己的电子书应用程序。我的书共有 15 章，因此我有一个包含 15 个元素的列表 - 每个元素都是一个包含所有章节文本的字符串。我还有 15 个 .ogg 文件，是我花钱请配音人员录制的。
Xcode - 产品存档文件 xcarchive 太大
我正在部署一个应用程序，该应用程序具有大约 10 个库依赖项(我正在使用 cocoapods)和 appstore 上 30MB 的下载大小，但是当我归档产品以供 Appstore 上传时，xcarc
python - pygame.FULLSCREEN 太大
我正在开发一款全屏游戏，我正在尽最大努力确保它适合所有屏幕尺寸。这被证明是相当困难的，因为当我使用 pygame.FULLSCREEN 时，窗口比屏幕大得多。为了解决这个问题，我根据 python 将
swift - 如何重写(太大)IF 语句的代码？
我有一个项目，其中有一些UIbuttons，其中显示了不同的UIimages。通过用户交互，UIButtons 中可能存在任何 UIimages。该项目中有大约 1000 张图像。我已经初始化了一个名
Java - Eclipse JTextField 太大
我使用 Eclipse 中的 Window Builder 将 JTextField 添加到 JPanel 中，无论我尝试什么，文本字段都会显示如下: (来源:gyazo.com) 我尝试更改首选尺寸
MySQL select 太大(连接三个表)
我有一个查询，我正在选择一个大型数据集，并且由于连接表的一对多关系而花费了非常多的时间。我有三个表——简化后如下: 客户 | customers | CREATE TABLE `customers`
android - PopupWindow 填充 - 太大
我在 Activity 中使用了一个 PopupWindow，除了 PopupWindow 中包含的元素的填充外，一切正常> - 它太大了 - 几乎占据了 PopupWindows 的大部分小空间。这
ios - 无法保存或正确调用电话号码，ios 太大
这个问题在这里已经有了答案: NSString intValue not working for retrieving phone number (2 个答案) 关闭 9 年前。
ios - UITableView ImageView 太大
我对为什么我的图片大小不正确感到有点困惑。我将 44x44 大小的图像传递给默认行高为 44 像素的 UITableView，但我得到以下结果: 这不是我应该如何设置我的 UITableViewCel
css 圆形图像 anchor 太大
我目前正在用 php 显示用户个人资料图片，如果他们单击它，就会转到他们自己的个人资料。图像显示正确并且链接有效，但链接的区域超出了图片并超过了附近的链接。我将如何减少 anchor 的面积？
html - 图片/div 太大
这张图片太大了，我想让它适合窗口的大小:http://zgaming.comxa.com 但是我不明白怎么办，我也试过高度和宽度100% html CSS .bgimg { posi
c++ - 关联矩阵 C++ 太大
减少矩阵大小的方法在哪里？ (x2 阵列)例如，我只需要将数据 (0, 1, 2) 存储到数组中但元素最多可达 250 000。？有没有办法存储值，比如在字典中......？ const int MA

首页

博学

6Ren·AI

商城

c++ - OpenCL - 我的数组怎么会太大而导致堆栈溢出？