- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
RenderScript 是否保证从 Java 层绑定(bind)的全局指针中的内存布局或跨度?
我读了somewhere最好使用 rsGetElementAt/rsSetElementAt 函数,因为不能保证布局。
但是elsewhere据说在针对 GPU 优化时要避免这些,而绑定(bind)指针是可以的。
在我的特殊情况下,我需要内核访问许多周围像素的值。到目前为止,我已经很好地处理了从 Java 层绑定(bind)的浮点指针。
Java:
script.set_width(inputWidth);
script.bind_input(inputAllocation);
回复:
int width;
float *input;
void root(const float *v_in, float *v_out, uint32_t x, uint32_t y) {
int current = x + width * y;
int above = current - width;
int below = current + width;
*v_out = input[above - 1] + input[above ] + input[above + 1] +
input[current - 1] + input[current] + input[current + 1] +
input[below - 1] + input[below ] + input[below + 1] ;
}
这是对我实际所做工作的微不足道的简化,只是为了通过示例轻松说明。实际上,我正在做更多的这些组合并同时使用多个输入图像,以至于简单地预先计算“上方”和“下方”行的位置有助于缩短处理时间。
只要保证内存是连续的并且与您通常期望的顺序相同,一切都很好,到目前为止我的测试设备上没有任何问题。
但如果这种内存布局确实不能在所有设备/处理器上得到保证,并且步幅实际上可能会有所不同,那么我的代码显然会中断,我将被迫使用 rsGetElementAt,例如:
Java:
script.set_input(inputAllocation);
回复:
rs_allocation input;
void root(const float *v_in, float *v_out, uint32_t x, uint32_t y) {
*v_out = rsGetElementAt_float(input, x - 1, y - 1) + rsGetElementAt_float(input, x, y - 1) + rsGetElementAt_float(input, x + 1, y - 1) +
rsGetElementAt_float(input, x - 1, y ) + rsGetElementAt_float(input, x, y ) + rsGetElementAt_float(input, x + 1, y ) +
rsGetElementAt_float(input, x - 1, y + 1) + rsGetElementAt_float(input, x, y + 1) + rsGetElementAt_float(input, x + 1, y + 1) ;
}
使用 rsGetElementAt() 的脚本的平均执行时间(710 毫秒)几乎是使用 input[] 的内核执行时间(390 毫秒)的两倍,我猜是因为每次调用都必须独立地重新计算给定 x,y 坐标的内存偏移量。
我的脚本需要连续运行,所以我试图从中获得所有可能的性能,忽略如此可观的加速将是一个真正的遗憾。
所以我想知道是否有人可以阐明这一点。
是否真的存在绑定(bind)指针不是完全顺序的情况,有没有办法强制它们是?
在这种情况下 rsGetElementAt() 是否真的有必要,或者继续使用依赖于预定义步幅的绑定(bind)指针是否安全?
最佳答案
对于简单的一维分配,只能保证绑定(bind)指针是连续的。应使用 get/setElementAt_ 访问具有多于一维的任何类型。
性能评价:
rsGetElementAt_float() 通常会优于 rsGetElementAt(),因为它知道类型并且可以避免跨步查找。所有类型化的 get/set 方法都是如此。
您正在测试哪个操作系统版本? 4.4 对这种类型的代码进行了一些重大改进,在许多情况下应该能够将地址计算从循环中拉出来。
操纵指针的方法将强制某些 GPU 驱动程序回退到安全路径。
一些较新的驱动程序 (4.4.1) 将使用硬件地址计算单元来完全消除开销。
关于android - RenderScript 绑定(bind)指针与分配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20920724/
我刚接触 C 语言几周,所以对它还很陌生。 我见过这样的事情 * (variable-name) = -* (variable-name) 在讲义中,但它到底会做什么?它会否定所指向的值吗? 最佳答案
我有一个指向内存地址的void 指针。然后,我做 int 指针 = void 指针 float 指针 = void 指针 然后,取消引用它们以获取值。 { int x = 25; vo
我正在与计算机控制的泵进行一些串行端口通信,我用来通信的 createfile 函数需要将 com 端口名称解析为 wchar_t 指针。 我也在使用 QT 创建一个表单并获取 com 端口名称作为
#include "stdio.h" #include "malloc.h" int main() { char*x=(char*)malloc(1024); *(x+2)=3; --
#include #include main() { int an_int; void *void_pointer = &an_int; double *double_ptr = void
对于每个时间步长,我都有一个二维矩阵 a[ix][iz],ix 从 0 到 nx-1 和 iz 从 0 到 nz-1。 为了组装所有时间步长的矩阵,我定义了一个长度为 nx*nz*nt 的 3D 指针
我有一个函数,它接受一个指向 char ** 的指针并用字符串填充它(我猜是一个字符串数组)。 *list_of_strings* 在函数内部分配内存。 char * *list_of_strings
我试图了解当涉及到字符和字符串时,内存分配是如何工作的。 我知道声明的数组的名称就像指向数组第一个元素的指针,但该数组将驻留在内存的堆栈中。 另一方面,当我们想要使用内存堆时,我们使用 malloc,
我有一个 C 语言的 .DLL 文件。该 DLL 中所有函数所需的主要结构具有以下形式。 typedef struct { char *snsAccessID; char *
我得到了以下数组: let arr = [ { children: [ { children: [], current: tru
#include int main(void) { int i; int *ptr = (int *) malloc(5 * sizeof(int)); for (i=0;
我正在编写一个程序,它接受一个三位数整数并将其分成两个整数。 224 将变为 220 和 4。 114 将变为 110 和 4。 基本上,您可以使用模数来完成。我写了我认为应该工作的东西,编译器一直说
好吧,我对 C++ 很陌生,我确定这个问题已经在某个地方得到了回答,而且也很简单,但我似乎找不到答案.... 我有一个自定义数组类,我将其用作练习来尝试了解其工作原理,其定义如下: 标题: class
1) this 指针与其他指针有何不同?据我了解,指针指向堆中的内存。如果有指向它们的指针,这是否意味着对象总是在堆中构造? 2)我们可以在 move 构造函数或 move 赋值中窃取this指针吗?
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: C : pointer to struct in the struct definition 在我的初学者类
我有两个指向指针的结构指针 typedef struct Square { ... ... }Square; Square **s1; //Representing 2D array of say,
变量在内存中是如何定位的?我有这个代码 int w=1; int x=1; int y=1; int z=1; int main(int argc, char** argv) { printf
#include #include main() { char *q[]={"black","white","red"}; printf("%s",*q+3); getch()
我在“C”类中有以下函数 class C { template void Func1(int x); template void Func2(int x); }; template void
我在64位linux下使用c++,编译器(g++)也是64位的。当我打印某个变量的地址时,例如一个整数,它应该打印一个 64 位整数,但实际上它打印了一个 48 位整数。 int i; cout <<
我是一名优秀的程序员,十分优秀!