halide - 使用增强型生成器的双边网格生成器类-6ren

halide - 使用增强型生成器的双边网格生成器类

转载作者：行者123 更新时间：2023-12-02 03:57:15

我正在尝试使用增强的生成器类重新实现双边网格示例(例如使用 schedule() 和 generate()。但我在尝试编译代码时遇到错误。

g++ -std=c++11 -I ../../include/ -I ../../tools/ -I ../../apps/support/ -g -  fno-rtti bilateral_grid_generator.cpp ../../lib/libHalide.a ../../tools/GenGen.cpp -o bin/bilateral_grid_exec  -ldl -lpthread -lz
bin/bilateral_grid_exec -o ./bin  target=host 
Generator bilateral_grid has base_path ./bin/bilateral_grid
Internal error at /home/xxx/Projects/Halide/src/Generator.cpp:966 triggered by user code at /usr/include/c++/4.8/functional:2057:
Condition failed: generator
make: *** [bin/bilateral_grid.a] Aborted (core dumped)

看来我没有将RDom和GeneratorParam的定义放在正确的位置。由于 r.x 和 r.y 在 schedule() 和 generate() 中都使用，我想我应该把它作为类(class)成员。应该采取什么措施来解决这个问题？

这是我编写的代码。

class BilateralGrid : public Halide::Generator<BilateralGrid> {
public:
GeneratorParam<int>   s_sigma{"s_sigma", 8};

//ImageParam            input{Float(32), 2, "input"};
//Param<float>          r_sigma{"r_sigma"};

Input<Buffer<float>>  input{"input", 2};
Input<float>          r_sigma{"r_sigma"};

Output<Buffer<float>> output{"output", 2};

// Algorithm Description
void generate() {
    //int s_sigma = 8;
    // Add a boundary condition
    clamped(x,y) = BoundaryConditions::repeat_edge(input)(x,y);

    // Construct the bilateral grid
    Expr val = clamped(x * s_sigma + r.x - s_sigma/2, y * s_sigma + r.y - s_sigma/2);
    val = clamp(val, 0.0f, 1.0f);

    Expr zi = cast<int>(val * (1.0f/r_sigma) + 0.5f);

    // Histogram
    histogram(x, y, z, c) = 0.0f;
    histogram(x, y, zi, c) += select(c == 0, val, 1.0f);

    // Blur the grid using a five-tap filter
    blurz(x, y, z, c) = (histogram(x, y, z-2, c) +
                         histogram(x, y, z-1, c)*4 +
                         histogram(x, y, z  , c)*6 +
                         histogram(x, y, z+1, c)*4 +
                         histogram(x, y, z+2, c));
    blurx(x, y, z, c) = (blurz(x-2, y, z, c) +
                         blurz(x-1, y, z, c)*4 +
                         blurz(x  , y, z, c)*6 +
                         blurz(x+1, y, z, c)*4 +
                         blurz(x+2, y, z, c));
    blury(x, y, z, c) = (blurx(x, y-2, z, c) +
                         blurx(x, y-1, z, c)*4 +
                         blurx(x, y  , z, c)*6 +
                         blurx(x, y+1, z, c)*4 +
                         blurx(x, y+2, z, c));

    // Take trilinear samples to compute the output
    val     = clamp(input(x, y), 0.0f, 1.0f);
    Expr zv = val * (1.0f/r_sigma);
    zi      = cast<int>(zv);
    Expr zf = zv - zi;
    Expr xf = cast<float>(x % s_sigma) / s_sigma;
    Expr yf = cast<float>(y % s_sigma) / s_sigma;
    Expr xi = x/s_sigma;
    Expr yi = y/s_sigma;

    interpolated(x, y, c) =
        lerp(lerp(lerp(blury(xi, yi, zi, c), blury(xi+1, yi, zi, c), xf),
                  lerp(blury(xi, yi+1, zi, c), blury(xi+1, yi+1, zi, c), xf), yf),
             lerp(lerp(blury(xi, yi, zi+1, c), blury(xi+1, yi, zi+1, c), xf),
                  lerp(blury(xi, yi+1, zi+1, c), blury(xi+1, yi+1, zi+1, c), xf), yf), zf);

    // Normalize and return the output.
    bilateral_grid(x, y) = interpolated(x, y, 0)/interpolated(x, y, 1);
    output(x,y)          = bilateral_grid(x,y);

}

// Scheduling
void schedule() { 
    // int s_sigma = 8;
    if (get_target().has_gpu_feature()) {
        // The GPU schedule
        Var xi{"xi"}, yi{"yi"}, zi{"zi"};

        // Schedule blurz in 8x8 tiles. This is a tile in
        // grid-space, which means it represents something like
        // 64x64 pixels in the input (if s_sigma is 8).
        blurz.compute_root().reorder(c, z, x, y).gpu_tile(x, y, xi, yi, 8, 8);

        // Schedule histogram to happen per-tile of blurz, with
        // intermediate results in shared memory. This means histogram
        // and blurz makes a three-stage kernel:
        // 1) Zero out the 8x8 set of histograms
        // 2) Compute those histogram by iterating over lots of the input image
        // 3) Blur the set of histograms in z
        histogram.reorder(c, z, x, y).compute_at(blurz, x).gpu_threads(x, y);
        histogram.update().reorder(c, r.x, r.y, x, y).gpu_threads(x, y).unroll(c);

        // An alternative schedule for histogram that doesn't use shared memory:
        // histogram.compute_root().reorder(c, z, x, y).gpu_tile(x, y, xi, yi, 8, 8);
        // histogram.update().reorder(c, r.x, r.y, x, y).gpu_tile(x, y, xi, yi, 8, 8).unroll(c);

        // Schedule the remaining blurs and the sampling at the end similarly.
        blurx.compute_root().gpu_tile(x, y, z, xi, yi, zi, 8, 8, 1);
        blury.compute_root().gpu_tile(x, y, z, xi, yi, zi, 8, 8, 1);
        bilateral_grid.compute_root().gpu_tile(x, y, xi, yi, s_sigma, s_sigma);
    } else {
        // The CPU schedule.
        blurz.compute_root().reorder(c, z, x, y).parallel(y).vectorize(x, 8).unroll(c);
        histogram.compute_at(blurz, y);
        histogram.update().reorder(c, r.x, r.y, x, y).unroll(c);
        blurx.compute_root().reorder(c, x, y, z).parallel(z).vectorize(x, 8).unroll(c);
        blury.compute_root().reorder(c, x, y, z).parallel(z).vectorize(x, 8).unroll(c);
        bilateral_grid.compute_root().parallel(y).vectorize(x, 8);
    }
}

Func clamped{"clamped"}, histogram{"histogram"};
Func bilateral_grid{"bilateral_grid"};
Func blurx{"blurx"}, blury{"blury"}, blurz{"blurz"}, interpolated{"interpolated"};
Var x{"x"}, y{"y"}, z{"z"}, c{"c"};
RDom r{0, s_sigma, 0, s_sigma};

};

//Halide::RegisterGenerator<BilateralGrid> register_me{"bilateral_grid"};
HALIDE_REGISTER_GENERATOR(BilateralGrid, "bilateral_grid");

}  // namespace

最佳答案

这里的错误很微妙，令人遗憾的是，当前的断言失败消息没有帮助。

这里的问题是这段代码使用 GeneratorParam (s_sigma) 初始化成员变量-RDom (r)，但是 GeneratorParam此时可能尚未设置其最终值。一般来说，访问GeneratorParam (或 ScheduleParam )在 generate() 之前调用方法会产生这样的断言。

这是为什么呢？让我们看看典型构建系统中生成器的创建和初始化方式:

GenGen.cpp 创建 Generator 的 C++ 类的实例；自然地，这会按照声明的顺序执行其 C++ 构造函数以及所有成员变量的 C++ 构造函数。
GenGen.cpp 使用命令行上提供的参数来覆盖 GeneratorParams 的默认值。例如，如果您使用 bin/bilateral_grid_exec -o ./bin target=host s_sigma=7 调用了生成器，默认值(8)存储在s_sigma中将替换为 7。
GenGen.cpp 调用 generate() ，然后schedule() ，然后将结果编译为 .o(或 .a 等)。

那么你为什么会看到这个断言呢？这段代码中发生的情况是，在上面的步骤 1 中， r 的 ctor正在步骤 1 中运行...但 r 的 ctor 的参数读取 s_sigma 的当前值，它有一个默认值 (8)，但不一定是构建文件指定的值。如果我们允许在没有断言的情况下进行此读取，则 s_sigma 可能会得到不一致的值。在生成器的不同部分。

您可以通过将 RDom 的初始化推迟到 generate() 来解决此问题方法:

class BilateralGrid : public Halide::Generator<BilateralGrid> { public: GeneratorParam<int> s_sigma{"s_sigma", 8}; ... void generate() { r = RDom(0, s_sigma, 0, s_sigma); ... } ... private: RDom r; };

(显然，断言失败需要更有用的错误消息；我将修改代码来做到这一点。)

关于halide - 使用增强型生成器的双边网格生成器类，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43410471/

文章推荐： python - 防止改变实例变量

文章推荐： java - LibGdx，渲染计数屏幕上的整数

文章推荐： c# - Moq 中是否有类似于 SetupGetSequence 的东西

文章推荐： java - 创建无限的字典或列表

java - 增强 for 循环的最后一次迭代
我正在尝试使用增强的 for 循环遍历 Iterable，但我无法确定何时处理最后一个值。 public void apply(Tuple key,
excel - 增强 excel 多个查找和替换脚本
我正在使用以下代码在 Sheet2 的 A:H 范围内查找和替换 Sheet1 中存在的单词列表(ColA 用于 FIND 单词，ColB 用于 REPLACE 单词)。它执行这项工作，但非常缓慢。可
java - 增强 Hibernate 数据库架构？
我正在使用 Hibernate (JPA2) hibernate.hbm2ddl.auto=update用于测试和 hibernate.hbm2ddl.auto=validate用于生产。我想要做的
scala - 增强 Scala 中的预定义方法
基本问题: 为什么我只能用 Scala 编写: println(10) 为什么我不需要写: Console println(10) 后续问题: 如何引入一个新方法“foo”，它像“println”一样
使用 Bazel 增强 Datanucleus
我正在尝试将 Maven 项目迁移到 Bazel，但在 Datanucleus 增强方面遇到了麻烦。后 jar -file 已构建，Datanucleus 会查看其中的内部并执行一些字节码操作以增强
javascript - 增强 JavaScript 代码的技巧
正在使用 css3 转换进行漂亮的导航。为此还编写了一些 javascript。但不幸的是它看起来有点凌乱。你们能给我一些优化 javascript 代码的技巧吗？笔--> http://code
buildr - 增强 Builder 发布流程
我想将自定义任务绑定(bind)到默认构建器发布周期中。我想在项目编译、打包、标记和部署之后但在增加版本号并提交之前运行此代码。我将如何融入发布周期的这一部分？最佳答案不幸的是，release
elasticsearch - 基于某些字段的ElasticSearch结果排序(相关分数)(增强)
我使用ElasticSearch 6.6。我的应用程序通过从不同数据源提取数据来构建ES索引。搜索未指定数据源。它只是建立一个类似的查询: GET employerdata/_search { "
c++ - 增强::精神::保持空白
我正在使用此代码将“k1 = v1; k2 = v2; k3 = v3; kn = vn”字符串解析为映射。 qi::phrase_parse( begin,end,
java - 增强 for 循环上的 ArrayIndexOutOfBounds
我正在试图弄清楚作业的一部分，但我已经把头撞在墙上有一段时间了。我正在尝试将 DNA 序列转录为 RNA 序列。然而，我收到了 ArrayOutOfBoundsException。我不熟悉使用增强的
python - 增强 GAE 错误报告以包含警告
我需要对基于 python Google App Engine 的应用程序的警告进行分类。我从 GAE stackdriver 下载日志。我认为 GAE Stackdriver 错误报告位于 http
python - 增强 is_valid() 但有异常
我有一个 django charField，通过 is_valid() 方法进行检查。用户应该在此字段中输入有效的逻辑表达式，因此我编写了一个解析方法，如果表达式不正确，该方法会引发异常。如何增强
c - 增强 2 个函数以提供正确的输出
我编写了以下控制台应用程序，要求用户输入一天。我需要一些帮助才能改进，以便他们为一周中的所有日子提供正确的答案。如果用户输入除星期一以外的任何其他日期，则输出为“今天”、“昨天”、“明天”，并在这
javascript - ES6 中的模块模式错误(增强)
我在使用带有 ES6 let 关键字的模块模式(扩充)时遇到错误。这有效。 var Example = ( Example => { Example.name = ""; retur
java - 线程 - 增强 - java
我只是问是否线程安全可以使用我明确指出“doSomething()”是线程安全的。最佳答案线程安全取决于您正在迭代的 Collection，而不是 enhanced for 的使用。如果 Col
javascript - 增强 Jquery 拖放演示
我有一个非常符合 this Jquery demo 的要求，这是一个简单的购物车演示。基本上，我需要对该演示进行两项改进。我需要文本输入以及可用的“产品”。因此，当我拖放其中一种产品时，文本字段应随
mysql - 增强 SQL 查询的性能
我正在三个表 messages、message_recipients 和 users 上运行查询。 messages表的表结构: id int pk message_id int message te
java - Java 增强 for 循环中的隐式语句
这个问题已经有答案了: In detail, how does the 'for each' loop work in Java? (29 个回答) 已关闭 4 年前。由于增强的 for 循环是只读
jquery - 增强 gif 背景翻转的性能
我在 css 中制作了一个很酷的鼠标悬停，当父级鼠标悬停时它会显示动画 gif。这是我的代码:http://codepen.io/clemeeent/pen/oggzMa 问题是我将有大约 40 天
javascript - 增强 Knockout 中的数组项上下文
目前，当使用 Knockout foreach 绑定(bind)时，您可以使用 $index 访问当前索引。我想让其他类似的功能可用于我的内部绑定(bind) - 例如: array(让我访问正在操作

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

halide - 使用增强型生成器的双边网格生成器类