c - CUDA 中的 tex1Dfetch 和流-6ren

c - CUDA 中的 tex1Dfetch 和流

转载作者：行者123 更新时间：2023-11-30 20:26:53

38

4

我一直在尝试使用流和一维纹理，但每次我查看它的内部时，纹理似乎都是空的。一开始我的计划是使用 2 个流，但我无法访问纹理，因此我将流的数量减少到 1 个(用于调试)，将内核减少到 1 个线程的 1 个 block ，如下所示。

#include <stdio.h>
#include <string.h>
#include <cuda.h>

texture <int,1,cudaReadModeElementType> tex1;

__global__
void textureTest(int *out){
    int  tid =  blockIdx.x * blockDim.x + threadIdx.x;
    float x;
    int i;
    for(i=0; i<30*8; i++){
        x = tex1Dfetch(tex1, i);
        printf("%d: %d \n ",i,x);
    }
    out[0]=x;
}

void testTextureCPU(){
    const int N = 100/2;
    int *array_d0;
    int *array_d1;
    int *array_h;
    int x=0;
    int *out_d0 =(int *)calloc(1, sizeof(int));
    int *out_d1 =(int *)calloc(1, sizeof(int));
    int *out_h =(int *)calloc(2, sizeof(int));

    cudaStream_t stream0, stream1;
    cudaStreamCreate(&stream0);
    cudaStreamCreate(&stream1);   

    cudaHostAlloc((void**)&array_d0, (30 * 8*sizeof(int)),cudaHostAllocDefault);
    cudaHostAlloc((void**)&array_d1, (30 * 8*sizeof(int)),cudaHostAllocDefault);
    cudaHostAlloc((void**)&array_h, (30 * 8*sizeof(int)),cudaHostAllocDefault);

    cudaMalloc((void **)&out_d0,  1 *sizeof(int));
    cudaMalloc((void **)&out_d1,  1 *sizeof(int));
    cudaHostAlloc((void**)&out_h, (2*sizeof(int)),cudaHostAllocDefault);


    array_h[8 * 10 + 0] = 10;
    array_h[8 * 11 + 1] = 11;
    array_h[8 * 12 + 2] = 12;
    array_h[8 * 13 + 3] = 13;
    array_h[8 * 14 + 4] = 14;
    array_h[8 * 15 + 5] = 15;
    array_h[8 * 16 + 6] = 16;
    array_h[8 * 17 + 7] = 17;

    for(x=0; x<2; x++){

        cudaMemcpyAsync(array_d0, array_h, (30 * 8*sizeof(int)), cudaMemcpyHostToDevice, stream0);
        cudaMemcpyAsync(array_d1, array_h, (30 * 8*sizeof(int)), cudaMemcpyHostToDevice, stream1);

        cudaBindTexture(NULL,tex1,array_d0, (30 * 8 *sizeof(int)));

        textureTest<<<1,2,0,stream0>>>(out_d0);

        cudaBindTexture(NULL,tex1,array_d0, (30 * 8 *sizeof(int)));

        textureTest<<<1,2,0,stream1>>>(out_d1);

        cudaMemcpyAsync(out_h+x, out_d0 , 1 * sizeof(int), cudaMemcpyDeviceToHost, stream0);
        cudaMemcpyAsync(out_h+x+N, out_d1 ,1 * sizeof(int), cudaMemcpyDeviceToHost, stream1);
    }
} 

int main(void){
    testTextureCPU();
    return 0;
}

但我无法弄清楚这段代码有什么问题，以及如何使其适用于一个或多个流。

最佳答案

您编辑的代码包含许多绝对基本的错误，这些错误与纹理或其与流的使用无关:

在内核中，有一个损坏的 printf 语句，它将浮点值视为整数
在主机代码中，用于填充纹理的主机内存大部分未初始化
在主机循环内，第二个 cudaMemcpyAsync 调用出现严重的缓冲区溢出

如果修复了这三件事，代码就会按预期工作。我建议您将来多加注意代码的质量。

关于c - CUDA 中的 tex1Dfetch 和流，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/23555150/

38

4

0

文章推荐： c# - Azure 云服务 - 部署错误

tex - 如何修改普通 TeX 中的纸张尺寸？
我的意思是整篇论文，而不仅仅是其中的文本区域。我希望 dvi 输出在查看器中看起来 1 厘米 x 10 米，如果我在 tex 文件中设置了这些尺寸。而且我不想为此通过 LaTeX。最佳答案在
tex - 如何在普通 TeX 中强制分页？
关闭。这个问题是off-topic .它目前不接受答案。想改善这个问题吗？ Update the question所以它是 on-topic对于堆栈溢出。 8年前关闭。 Improve this q
string - 将 Tex 字符串转换为 Tex 编号
我在需要数值的参数中使用自动生成的 Tex 字符串时遇到问题(例如，在 ifthenelse 比较中)。这是一个示例最小代码: \newcommand\testC{123} \ifthenelse{\
latex - 如果 TeX 是一种编程语言，我如何开始在 TeX 中编程？
我用的是 Mac。但我也有一台装有 Windows 7 的 PC。所以当我想开始使用 TeX 为 LaTeX 编程功能时，我的起点是什么？是否有 SDK 和文档？我找不到任何关于 TeX 编程的书。
sublimetext2 - 相当于Bash : `latexmk file.tex && latexmk -c file.tex` 的Python
在Xymostech的帮助下，已解决了将Bash中的&&转换为Python的问题，非常感谢其帮助-谢谢! 有争议的命令行(来自Bash终端)是:latexmk file.tex && latexmk
r - Tex Proof 环境未在 R Markdown 中定义，amsthm 未在生成的 Tex 文件中
[编辑以提供更多信息] 我正在使用以下 R markdown 文件生成以下 Tex 文件。我在我的 .rmd header 中包含了 amsthm，它正在生成一个没有 amsthm 的 Tex 文件。
python - Mac OS X 和 TeX Live 上 matplotlib 中的 TeX
我有以下 Hello World 代码来尝试在我的 Mac 上使用 matplotlib 进行 TeX 渲染。 import matplotlib.pyplot as plt from matplot
tex - 通过脚本下载背页项目源代码
如何使用命令行脚本下载背页项目的源代码？我想定期备份源文件，如果我可以自动下载而不是每次都通过 Web 界面进行下载会更好。我不知道任何允许我这样做的 API，有吗？我知道一个理想的解决方案可能会使
tex - 如何打开.tex文件？
我正在尝试打开.tex文件。我不确定我是否已经深入到了(可能)令人惊讶的复杂过程。有人告诉我可以用Notepad++做到这一点，然后继续下载。结果如下: %sample file for Model
在 TeX 方程中转义一个字符？
我想在 TeX 方程中使用包含破折号的变量名。但是，破折号被解释为减号。任何人都知道如何逃避角色？最佳答案使用\textrm{-} 不起作用？关于在 TeX 方程中转义一个字符？，我们在Stac
latex - TeX:字符串解析和空格剥离
在 TEX 中，如何分割字符串，例如 \mana{X1 2W/UB R /G}分成几部分并将它们提供给另一个宏(在这种情况下，用类似 \m{X}\m{12}\m{W/U}\m{B}\m{R/G} 的东
latex - TeX:在每个内容页后添加空白页
我目前正在写我的学士论文，我的大学想要一份单面打印。打印和装订将由专业打印公司完成。他们只接受双面手稿。因此，我需要在每一页内容后添加一个空白页。我不想使用 \newpage 手动执行此操作或 \c
vim - 如果文件类型 == tex
我想在 .vimrc 中运行一个命令，以防文件是 latex 文件。我想我有一些语法问题，它不起作用。有什么线索吗？ if &filetype=='tex' set spell endif 最
latex - TeX 字体映射
我正在使用在 XeLaTeX 之上编写的包。该包使用fontspec为文本的不同部分指定字体:拉丁语、非拉丁语、数学模式…… 该软件包附带了几个示例文件。我能够 xelatex 其中大多数依赖于常规
MATLAB TeX 字符表？
在 mathworks.com 的在线文档中，哪里有 MATLAB 支持的 TeX 字符子集表？我习惯于轻松找到它，但我却找不到:在此页面上 http://www.mathworks.com/hel
python - TeX 输入的引号字符串
我正在编写一个 Python 脚本，它将纯文本作为输入并生成LaTeX 代码作为输出。在某些时候，脚本必须引用所有在 TeX 中有特殊含义的字符，如 %、&、\ 等上。这比我想象的要难。目前我有这个
javascript - 从数据库中的内容渲染 TeX？
我正在使用 Firebase 将内容放到网站上。类似“获取多项选择题/选项并将它们插入 div 标签”之类的东西。其中一些问题使用数学/化学方程，我认为 TeX 将是一个很好的渲染工具。基本上，如果
linux - Tex 发送另一个命令
假设我有一个文本文件 something.txt。写着4062,2016-12-31 我想在脚本中的一个命令中发送“4062”，在另一个命令中将“2016-12-31”作为字符串发送。可以用 BASH
ubuntu - 如何将其他语言添加到 TeX
在 MediaWiki 中，如果您在公式中添加非英语文本，它会剪切。例如，如果您编写 \text{щfбb}(щ 和 б 俄语(西里尔)符号)输出将是 fb 不是 щfбb。最佳答案首先，如果您的
cuda - tex 对象访问总是返回零——有什么想法吗？
我正在运行 CUDA 5.0，使用 670 设置了 compute_30、sm_30。我通过以下方式创建一个 mipmapped 数组: cudaExtent size; size.width =

首页

博学

6Ren·AI

商城

c - CUDA 中的 tex1Dfetch 和流