cuda - 对网格和 block 尺寸的混淆-6ren

cuda - 对网格和 block 尺寸的混淆

转载作者：行者123 更新时间：2023-12-04 17:36:34

24

4

我正在尝试在 Udacity 的第 1 课结束时解决问题当然，但我不确定我是否只是打错字或者实际代码是否错误。

void your_rgba_to_greyscale(const uchar4 * const h_rgbaImage, uchar4 * const d_rgbaImage, unsigned char* const d_greyImage, size_t numRows, size_t numCols)
{
    size_t totalPixels = numRows * numCols;
    size_t gridRows = totalPixels / 32;
    size_t gridCols = totalPixels / 32;
    const dim3 blockSize(32,32,1);
    const dim3 gridSize(gridCols,gridRows,1);
    rgba_to_greyscale<<<gridSize, blockSize>>>(d_rgbaImage, d_greyImage, numRows, numCols);
    cudaDeviceSynchronize(); checkCudaErrors(cudaGetLastError());
}

另一种方法是:

void rgba_to_greyscale(const uchar4* const rgbaImage, unsigned char* const greyImage, int numRows, int numCols)
{   
    int x = (blockIdx.x * blockDim.x) + threadIdx.x;
    int y = (blockIdx.y * blockDim.y) + threadIdx.y;
    uchar4 rgba = rgbaImage[x * numCols + y];
    float channelSum = 0.299f * rgba.x + 0.587f * rgba.y + 0.114f * rgba.z;
    greyImage[x * numCols + y] = channelSum;
}

错误消息显示以下内容:

libdc1394 error: failed to initialize libdc1394
Cuda error at student_func.cu:76
unspecified launch failure cudaGetLastError()
we were unable to execute your code. Did you set the grid and/or block size correctly?

但是，它说代码已经编译，

Your code compiled!
error output: libdc1394 error: Failed to initialize libdc1394
Cuda error at student_func.cu:76
unspecified launch failure cudaGetLastError()

第 76 行是第一个代码块中的最后一行，据我所知，我没有更改任何内容。第76行如下，

rgba_to_greyscale<<<gridSize, blockSize>>>(d_rgbaImage, d_greyImage, numRows, numCols);

我实际上找不到 cudaGetLastError() 的声明.
我主要关心的是我对设置网格/ block 尺寸的理解+第一种方法方法是否适合一维像素位置数组和我的线程之间的映射。
编辑:
我想我误解了什么。是 numRows垂直方向的像素数？是 numCols水平方向的像素？
我的 block 由 8 x 8 个线程组成，每个线程代表 1 个像素？如果是这样，我假设这就是为什么我在计算 gridRows 时必须除以 4 的原因。因为图像不是正方形的？我假设我也可以制作一个 2:1 列的 block :行？
Screen shot

编辑 2:
我只是试图改变我的 block ，使它成为 2:1 的比例，所以我可以划分 numRows和 numCol相同的数字，但现在在底部和侧面显示空白区域。为什么底部和侧面都有空白区域。我没有改变网格或 block 的 y 尺寸。
enter image description here

最佳答案

每个 block 处理 32*32 像素，并且有 (totalPixels/32) * (totalPixels/32) 个 block ，所以你处理 totalPixels ^ 2 个像素 - 这似乎是错误的

第一个是错误的，这应该是正确的:

const dim3 blockSize(32,32,1);

size_t gridCols = (numCols + blockSize.x - 1) / blockSize.x;
size_t gridRows = (numRows + blockSize.y - 1) / blockSize.y;

这是 2d 的一个非常常见的模式 - 你可以记住它

在示例图像大小不是 2 的幂，并且您希望 block 覆盖所有图像(甚至更多)

所以下一个必须是正确的:
gridCols * blockSize.x >= numCols
gridRows * blockSize.y >= numRows

您选择 block 大小并根据它计算需要覆盖所有图像的 block 数量

之后，在内核中，您必须检查您是否没有“超出图像”，对于大小错误的情况

另一个问题在内核中，它必须是 (y * numCols + x)，而不是相反

核心:

int x = (blockIdx.x * blockDim.x) + threadIdx.x;
int y = (blockIdx.y * blockDim.y) + threadIdx.y;

if(x < numCols && y < numRows)
{
    uchar4 rgba = rgbaImage[y * numCols + x];
    float channelSum = 0.299f * rgba.x + 0.587f * rgba.y + 0.114f * rgba.z;
    greyImage[y * numCols + x] = channelSum;
}

调用代码:

const dim3 blockSize(4,32,1); // may be any

size_t gridCols = (numCols + blockSize.x - 1) / blockSize.x;
size_t gridRows = (numRows + blockSize.y - 1) / blockSize.y;

const dim3 gridSize(gridCols,gridRows,1);
rgba_to_greyscale<<<gridSize, blockSize>>>(d_rgbaImage, d_greyImage, numRows, numCols);
cudaDeviceSynchronize(); 
checkCudaErrors(cudaGetLastError());

该死，我觉得我做的事情更难理解(

关于cuda - 对网格和 block 尺寸的混淆，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/17085968/

24

4

0

文章推荐： opengl-es - 如何在 OpenGL ES 2.0 中获得 Alpha 混合透明度？

文章推荐： wordpress - 是否可以在 View 文件夹之外使用 laravel Blade ？

文章推荐： vbscript - 在 vbscript 中获取无效的过程调用或参数

文章推荐： .net - 使用 Entity Framework 4 删除对象的最简单方法

java - 与 JAX-RS 混淆，Jersey 与 JAX-RS 混淆
我真的很困惑。我已经尝试使用带有 tomcat 的 Jax-rs 并使用所有注释，我能够使用 url 调用我的服务。因此，如果没有 Jax-rs，我可以简单地拥有一个 servlet 并调用我的服务。
BAML 混淆
是否有任何工具/商业混淆器可以混淆 WPF 控件中的 BAML 资源？如果没有，就 IP 保护而言，这是一段艰难的时期，因为黑客可以通过使用 BAML 到 XAML 转换器轻松查看 BAML 资源。
COBOL 混淆
嘿大家。我在尝试使用 COBOL 在 zOS 环境中解决的编码项目中遇到了一些麻烦。我需要读入一个文件并将它们放入索引表中(我知道将少于 90 条记录)。让我感到困扰的是，我们受到项目参数的约束，以
Java线程join()混淆
我试图按照这个例子来理解 join() 方法: class PrintDemo { public void printCount() { try { for(int
Java编译器自动重命名参数(混淆)
当我编译我正在编写的代码，然后在 JD Gui 中查看时，方法显示带有如下标题: public void growSurface(Random paramRandom, int paramInt1,
Android库项目——混淆
我正在为重新分发准备 Android 库，它的代码必须进行混淆处理。我已经阅读了有关此主题的一些内容，并且决定使用 Android Library Project。它将作为 jar 分发(自动在/bi
F# MSIL 混淆
两个混淆相关的问题: 1) 是否有任何工具可以将 F# 从 MSIL 目标形式反汇编回其源形式或接近它的形式？这不是通过默默无闻来实现安全性的尝试，但我想保护某些源代码免遭“盗窃”。 2) 我简要地查
r - MCMClogit 混淆
谁能向我解释为什么 simulatedCase <- rbinom(100,1,0.5) simDf <- data.frame(CASE = simulatedCase) posterior_m0
.NET AppDomain 混淆
我一直无法找到关于使用 AppDomains 时发生的事情的非常清楚的描述，所以希望有人能够启发我。我有一个简单的测试程序(基本上是扯掉了 MSDN example ): using System;
git rebase 混淆
假设我有 2 个分支topic和 master如果我在 topic分支，然后运行 git rebase master它是 rebase master 还是 rebase 主题分支？做 git r
c# - 线程同步被锁(this)混淆
我有一个类(class): public class LockTest { public void LockThis() { lock (this)
javascript - AngularJS 混淆
我正在尝试最小化/混淆我的 Angular 代码，但遇到了问题。我在这里阅读“缩小说明”http://docs.angularjs.org/tutorial/step_05但我定义我的 Control
Javascript float 混淆
我遇到了一些困惑的操作。 var a = 0.1; var b = 0.2; var c = 0.3; console.log(a); // 0.1 console.log(b); // 0.2 co
JavaScript 下拉列表不会在点击时关闭，混淆？
感谢您查看我的帖子 - 我正在尝试弄清楚如何在单击链接时关闭此下拉菜单，但我的 JavaScript 技能非常缺乏，而且代码似乎很困惑。这是 HTML:
encryption - 混淆、散列和加密之间有什么区别？
混淆、哈希和加密之间有什么区别？这是我的理解: 哈希是一种单向算法；无法逆转混淆与加密类似，但不需要任何“ secret ”即可理解(ROT13 就是一个例子) 加密是可逆的，但需要“ secre
变量之间的 Perl 混淆
我有以下代码 my $content = $response->content; $content =~ /username=([\s\S]+?)&/; my $username = $1; prin
dynamic - 匿名类型列表和动态...混淆
我在 .NET 中发现了一些与我预期的有点不同的东西。我粘贴的代码没有意义，但它是我拥有的一个复杂得多的函数的浓缩版。我实际上是在获取匿名类型信息作为参数(尚未创建匿名类型的实例)，我需要创建该类型的
JavaFX Proguard 混淆
我正在努力解决 JavaFX 应用程序的混淆问题。使用此项目作为基础: https://github.com/openjfx/samples/tree/master/IDE/IntelliJ/Non-
java - 混淆 CSV
是否可以制作一个与此类似的 CSV 阅读器 while((line = reader.readLine()) != null){ String[] values = line.
java - 字符串输出与 + 混淆
公共(public)类测试2 { 公共(public)静态无效主(字符串[]参数){ System.out.println("3 + 6"); System.out.println(3

首页

博学

6Ren·AI

商城

cuda - 对网格和 block 尺寸的混淆