c++ - Halide 元组用法-6ren

c++ - Halide 元组用法

转载作者：行者123 更新时间：2023-11-30 02:44:28

25

4

我想使用 Halide 生成多个输出缓冲区。

Func output;
std::vector<Expr> argsExpr( 4 );
argsExpr[ 0 ] = aOut( x, y );
argsExpr[ 1 ] = bOut( x, y );
argsExpr[ 2 ] = cOut( x, y );
argsExpr[ 3 ] = dOut( x, y );
output( x, y ) = Tuple( argsExpr );

这个例子工作正常，但我想知道是否可以有多个输出，但大小不同，比如:

std::vector<Expr> argsExpr( 4 );
argsExpr[ 0 ] = aOut( x, y, c );
argsExpr[ 1 ] = bOut( x, y );
argsExpr[ 2 ] = cOut( x, y );
argsExpr[ 3 ] = dOut( x, y );
output( x, y, ? ) = Tuple( argsExpr );

我从 Halide 收到关于输出 0 和输出 1 之间差异的错误。

我假设我只想要一个编译 (compile_to_file)，而不是多个 Object 文件。

周杰伦

最佳答案

目前，所有输出(实现的元素)必须具有相同数量的维度、最小值和范围。只有元素的类型可以变化。 Andrew 有一个取消此限制的计划，但我不会在不到 6 到 9 个月的时间内依赖它。

关于c++ - Halide 元组用法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/25295451/

25

4

0

文章推荐： java - Hibernate 忽略带有投影 beans 的链式 setter

文章推荐： java - java中数组和二维数组相乘

文章推荐： onCreateView() 中抽屉导航中的 Android Google Map v2

c++ - Halide:将 C++ 函数传递给 Halide Func
我有一张二值图像，我想使用 Halide 从图像的顶部开始为每一列找到第一个非零像素。在 C++ 中，给定名为 mask 的图像，它看起来像这样: vector top_y; top_y.reser
halide - 使用增强型生成器的双边网格生成器类
我正在尝试使用增强的生成器类重新实现双边网格示例(例如使用 schedule() 和 generate()。但我在尝试编译代码时遇到错误。 g++ -std=c++11 -I ../../includ
halide - 使用增强型生成器的双边网格生成器类
我正在尝试使用增强的生成器类重新实现双边网格示例(例如使用 schedule() 和 generate()。但我在尝试编译代码时遇到错误。 g++ -std=c++11 -I ../../includ
Halide:OpenCL 代码生成
是否可以在 Halide 中生成包含生成的 OpenCL 代码的文件？我试图从目标是 opencl 的 Halide 程序生成一个 c 文件，但我在那里没有看到任何 opencl 特定代码。编辑1:
halide - 为什么我的表现不好？ (菜鸟调度)
我主要是一名非常高级的程序员，因此思考 CPU 局部性等问题对我来说是非常新鲜的。我正在研究一个基本的双线性去马赛克(用于 RGGB 传感器数据)，并且我的算法是正确的(根据结果判断)，但它的性能没
c++ - Halide 最优调度
我正在尝试为基准 Halide 代码制定最佳时间表，但我可能会遗漏一些东西，因为计时结果对我来说意义不大。我正在使用 AOT 编译，下面是代码的算法部分: ImageParam input1(typ
c++ - Halide 如何自动调整时间表
我已经尝试用 Halide 编写代码一段时间了，而且我总是自己编写时间表。然后我读了这篇论文:http://graphics.cs.cmu.edu/projects/halidesched/mulla
c++ - Halide 元组用法
我想使用 Halide 生成多个输出缓冲区。 Func output; std::vector argsExpr( 4 ); argsExpr[ 0 ] = aOut( x, y ); argsExp
c++ - Halide 在归一化互相关期间挂起
我正在尝试在 Halide 中实现归一化互相关。下面的代码构建，Halide JIT 编译不会抛出任何错误。但是，Halide 似乎在 JIT 编译后挂起。无论我对不同的 Func 调用了多少次 t
c++ - Halide 外部法
我使用 AOT 编译来使用没有 Halide 库的 Halide 代码。我在 HalideRuntime.h(在资源中可用)中看到我的 .o 文件中有许多可用的外部方法。 halide_dev_ma
c++ - Halide 编程语言入门？
我正在尝试开始使用一种名为 Halide 的用于图像处理的特定领域语言(C++ 扩展) . 在 Halide README 之后，这是我尝试过的: 下载了 Ubuntu 12.04 Halide bi
c++ - Halide - while 循环等效
我正在尝试在 Halide 中实现 Meijster 距离变换算法。我已经重写了 this code到 C++(使用 openCV)并且工作正常。关于该算法的论文是here .现在我的 Halide
c++ - Halide 可变域减少
现在我正在尝试编写一些对图像进行子采样的 Halide 代码。基本上我希望图像的每 2 x 2 平方减少到一个包含最大值的像素。一个简单的例子是转换 1 2 3 4 5 6 7 8 9 0 1 2 4
c++ - Halide 的性能计数器？
是否有适用于使用 Halide 语言编写的代码的性能计数器？我想知道我的代码执行了多少加载、存储和 ALU 操作。用于调度多阶段管道的 Halide 教程通过比较分配的内存量、加载、存储和对 hal
c++ - 无法在 Halide 中加载灰度图像
尝试加载灰度图像png格式以执行此代码时出现错误。我的程序是Halide Tutorial类(class)2的一部分。这是我的代码: #include #include "Halid
c++ - 带有GPU时间表的 Halide 产生黑色图像
我正在尝试学习Halide，但我无法正确使用GPU，因为在安排GPU时它会生成黑色图像。对于CPU而言，它会产生良好的结果(注释掉brighter.gpu_tile(x，y，xo，yo，xi，yi，8
c++ - Halide FFT 实现错误？
我正在尝试运行找到的 Halide FFT 实现 here用于针对 FTTW 进行基准测试。我能够按原样运行实现，但在深入挖掘时遇到了一些问题。该例程因 H 和 W 的不同值(随机输入图像的高度和宽度
c++ - Halide Jit 编译
我正在尝试将我的 Halide 程序编译为 jit，以便稍后在不同图像的代码中多次使用它。但是我想我做错了什么，有人可以纠正我吗？首先，我创建要运行的 Halide 函数: void m_gammaF
python - 更改 Halide 输出缓冲区布局
我正在尝试更改实现的缓冲区布局。我知道 Halide 的目的是允许“一次”定义算法，然后能够分别更改调度和存储布局等内容。我已经尝试过 my_output_function.reorder_stor
c++ - 如何使用 Halide 分析器
几周来我一直在探索 Halide 的可能性，为了更好地了解 Halide 的作用，我想尝试使用 halide 分析器。假设我有一个 Func 测试。 (为了便于阅读，我省略了变量声明等。)f=函数(测

首页

博学

6Ren·AI

商城

c++ - Halide 元组用法