- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我们正在使用 renderscript 进行音频 dsp 处理。它很简单,并且可以显着提高我们用例的性能。但是,在启用了 GPU 执行的自定义驱动程序的设备上,我们遇到了一个关于 USAGE_SHARED
的恼人问题。
如您所知,USAGE_SHARED
flag 使渲染脚本分配重用给定的内存,而无需创建它的副本。因此,它不仅可以节省内存,在我们的例子中,还可以将性能提高到所需的水平。
以下带有 USAGE_SHARED
的代码在默认渲染脚本驱动程序 (libRSDriver.so
) 上运行良好。使用自定义驱动程序 (libRSDriver_adreno.so
) USAGE_SHARED
不会重用给定的内存和数据。
这是使用 USAGE_SHARED
并调用 renderscript 内核的代码
void process(float* in1, float* in2, float* out, size_t size) {
sp<RS> rs = new RS();
rs->init(app_cache_dir);
sp<const Element> e = Element::F32(rs);
sp<const Type> t = Type::create(rs, e, size, 0, 0);
sp<Allocation> in1Alloc = Allocation::createTyped(
rs, t,
RS_ALLOCATION_MIPMAP_NONE,
RS_ALLOCATION_USAGE_SCRIPT | RS_ALLOCATION_USAGE_SHARED,
in1);
sp<Allocation> in2Alloc = Allocation::createTyped(
rs, t,
RS_ALLOCATION_MIPMAP_NONE,
RS_ALLOCATION_USAGE_SCRIPT | RS_ALLOCATION_USAGE_SHARED,
in2);
sp<Allocation> outAlloc = Allocation::createTyped(
rs, t,
RS_ALLOCATION_MIPMAP_NONE,
RS_ALLOCATION_USAGE_SCRIPT | RS_ALLOCATION_USAGE_SHARED,
out);
ScriptC_x* rsX = new ScriptC_x(rs);
rsX->set_in1Alloc(in1Alloc);
rsX->set_in2Alloc(in2Alloc);
rsX->set_size(size);
rsX->forEach_compute(in1Alloc, outAlloc);
}
注意:文档中未提及 Allocation::createTyped()
的变体,但代码 rsCppStructs.h
中有。这是允许提供支持指针并尊重 USAGE_SHARED
标志的分配工厂方法。这是它的声明方式:
/**
* Creates an Allocation for use by scripts with a given Type and a backing pointer. For use
* with RS_ALLOCATION_USAGE_SHARED.
* @param[in] rs Context to which the Allocation will belong
* @param[in] type Type of the Allocation
* @param[in] mipmaps desired mipmap behavior for the Allocation
* @param[in] usage usage for the Allocation
* @param[in] pointer existing backing store to use for this Allocation if possible
* @return new Allocation
*/
static sp<Allocation> createTyped(
const sp<RS>& rs, const sp<const Type>& type,
RsAllocationMipmapControl mipmaps,
uint32_t usage,
void * pointer);
这是渲染脚本内核
rs_allocation in1Alloc, in2Alloc;
uint32_t size;
// JUST AN EXAMPLE KERNEL
// Not using reduction kernel since it is only available in later API levels.
// Not sure if support library helps here. Anyways, unrelated to the current problem
float compute(float ignored, uint32_t x) {
float result = 0.0f;
for (uint32_t i=0; i<size; i++) {
result += rsGetElementAt_float(in1Alloc, x) * rsGetElementAt_float(in2Alloc, size-i-1); // just an example computation
}
return result;
}
如前所述,out
没有任何计算结果。 syncAll(RS_ALLOCATION_USAGE_SHARED)
也没有帮助。
下面的虽然有效(但慢得多)
void process(float* in1, float* in2, float* out, size_t size) {
sp<RS> rs = new RS();
rs->init(app_cache_dir);
sp<const Element> e = Element::F32(rs);
sp<const Type> t = Type::create(rs, e, size, 0, 0);
sp<Allocation> in1Alloc = Allocation::createTyped(rs, t);
in1Alloc->copy1DFrom(in1);
sp<Allocation> in2Alloc = Allocation::createTyped(rs, t);
in2Alloc->copy1DFrom(in2);
sp<Allocation> outAlloc = Allocation::createTyped(rs, t);
ScriptC_x* rsX = new ScriptC_x(rs);
rsX->set_in1Alloc(in1Alloc);
rsX->set_in2Alloc(in2Alloc);
rsX->set_size(size);
rsX->forEach_compute(in1Alloc, outAlloc);
outAlloc->copy1DTo(out);
}
复制使其工作,但在我们的测试中,来回复制会显着降低性能。
如果我们通过 debug.rs.default-CPU-driver
系统属性关闭 GPU 执行,我们可以看到自定义驱动程序可以很好地实现所需的性能。
将提供给 renderscript 的内存对齐到 16、32、.. 或 1024 等无助于使自定义驱动程序遵守 USAGE_SHARED。
因此,我们的问题是:如何使该内核适用于使用支持 GPU 执行的自定义渲染脚本驱动程序的设备?
最佳答案
即使您使用 USAGE_SHARED,您也需要拥有该副本。
USAGE_SHARED 只是给驱动的一个提示,不一定非得用。
如果驱动程序确实共享内存,则副本将被忽略并且性能将相同。
关于android - 如果 USAGE_SHARED,Renderscript 在启用 GPU 的驱动程序上失败,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50548979/
OpenCL doesn't support recursion . CUDA does, but only from a certain version .初始搜索表明 RenderScript 确
是否可以使用 RenderScript 拍摄 Y'UV 格式的相机图像: 将其转换为 RGBA 裁剪到特定区域 必要时旋转它 最佳答案 是的!我想出了如何并认为我会与他人分享。 RenderScrip
我希望从我的 renderscript 内核返回一个结构数组。我的问题是,虽然我可以使用生成的代码在 java 中创建一个结构数组,并通过获取由此生成的数组的分配将其传递给我的根方法,但我无法将数组返
我似乎找不到任何关于如何检查 RenderScript 是否真正并行化代码的文档。我想知道是否正在使用 CPU 或 GPU 以及调度的线程数。 我唯一发现的是这个错误报告: http://code.g
我想用 renderscript 做一些实验,所以我从 sdk 附带的示例开始,但不幸的是我无法编译它。是否有任何我可能需要的额外工具来编译和构建该示例,我曾尝试阅读文档。但他们什么也没提到。 示例项
使用 gradle:3.3.0-alpha06 更新到 Android Studio 3.3 Canary 6 后,我开始收到错误 Cannot find file sdk\build-tools\2
我编写了以下渲染脚本: ushort* curve_hth; ushort* curve_hts; ushort* curve_htv; ushort* curve_sth; ushort* curv
我开始探索 renderscript 的强大功能。 尝试使用 2D 图像数据,我可以将像素转换为其他像素。但是,如何从输入分配中获取相邻像素? 我想知道例如内置的 convolve3x3 过滤器是如何
renderscript 做矩阵计算很强大,但是如果我想处理当前帧和前一帧之间的差异。 正确的做法是什么: 在 renderscript 中保存前一帧,然后在新帧进来后进行计算。 在 java 中保存
如何在调用 rsgDrawText 之前设置字体特性?我对能够设置字体大小特别感兴趣。 最佳答案 这是一个多部分的过程。在用于控制 RenderScript 运行时(通常拥有脚本的文件)的文件中,在初
我想知道是否可以使用 RenderScript 引擎来优化算法。 该算法对图像进行迭代处理,直到满足某些条件。在处理所需的迭代次数之前无法知道。但我只看到 RenderScript 示例在具有 N 个
我注意到我实际上可以对 ScriptIntrinsicBlur 的输入和输出使用相同的分配。 .由于我对未过滤的分配不感兴趣,因此这种方法不需要创建另一个分配并且在内存方面更好。 但是,它安全吗?我在
我可以在适用于 android 2.2 及更高版本的应用程序中使用 renderscript 吗?因为我知道它已被用于墙纸,但仅限于内部。那改变了吗,因为 renderscript 现在是公开的?我正
我找到了这个 link我想试试轮播的例子。我将所有类和 rs 文件(轮播示例中的所有内容)复制到我自己的项目中,并尝试在实际设备(摩托罗拉 xoom)上构建它。但我一直在强制关闭。 logcat 中的
是否可以在 RenderScript for Android 中使用二维数组?分配只允许我将一个向量(一维)数组放入分配中。但我不知道如何生成二维数组。我 found a google groups
我正在编写一小段 Renderscript 来动态拍摄图像并根据每个像素的 RGB 值将像素分类到“桶”中。桶的数量可能会有所不同,所以我的直觉是创建一个数组列表。显然,这在 Renderscript
我想更好地了解内存分配在 Renderscript 中的工作原理。 首先,我想确认内存是在运行时还是编译时分配的。 文档指出: Non-static, global variables that yo
为了对齐两个灰度图像的强度值(作为进一步处理的第一步),我编写了一个 Java 方法: 将两个图像的位图转换为两个包含位图强度的 int[] 数组(我在这里只取红色分量,因为它是灰度,即 r=g=b
无法理解,因为当我尝试将 Allocation 用作输入和输出时,程序崩溃了。 我已经检查过是否由于 android list 中的某种类型的权限,但都没有。 project.properties如下
我正在编写渲染脚本代码,我需要一些实用函数。但是当我编写这些函数并进行编译时,我收到一条错误消息,指出可调用函数必须返回 void。他们正在强制执行此操作,以便所有渲染脚本可调用函数都可以异步运行。但
我是一名优秀的程序员,十分优秀!