- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我用谷歌搜索了几次,但没有得到直接的答案。我有一个矩阵,我想与离散滤波器(例如用于边缘检测的 Sobel 算子)进行卷积。是否可以在 iPhone 上使用 OpenGL ES 以加速方式完成此操作?
如果是的话,怎么样?如果不是,我可以使用其他高性能技巧来加速操作吗?神奇的 ARM 汇编操作可以快速完成吗?最终,我希望在 iPhone 的 ARM 处理器上尽可能快地执行卷积。
最佳答案
您应该能够在 OpenGL ES 2.0 下使用可编程着色器来完成此操作。我在 iTunes U 类(class)的视频中更详细地描述了 OpenGL ES 2.0 着色器。
虽然我自己没有做过图像卷积,但我描述了一些适用于 Mac 和 iOS 的 GPU 加速图像处理
here 。我提出一个
sample application它使用 GLSL 着色器(基于 Apple 开发的 Core Image 滤镜),从 iPhone 的相机源进行实时颜色跟踪。
自从我写这篇文章以来,我创建了一个 open source framework基于上面的示例,该示例具有内置图像卷积滤波器,范围从 Sobel 边缘检测到自定义 3x3 卷积核。它们的运行速度比受 CPU 限制的实现快 100 倍。
但是,如果您要在 CPU 上执行此操作,则可能可以使用 Accelerate framework在 iPhone 的 NEON SIMD 单元上运行一些操作。特别是,FFT 运算(这通常是图像卷积滤波器中的关键组件,或者我听说过)可以通过使用 Apple 此处提供的例程获得约 4-5 倍的加速。
关于iphone - 在 iPhone 上使用 OpenGL ES 卷积图像 : possible?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4270737/
我正在尝试构建不同(但每个同质)类型的可遍历项的多个交叉产品。所需的返回类型是元组的可遍历对象,其类型与输入可遍历对象中的类型相匹配。例如: List(1, 2, 3) cross Seq("a",
import java.util.Scanner; public class BooleanProduct { public static void main(String[] args) {
任务 - 数字的最大 K 积 时间限制:1 内存限制:64 M 给定一个整数序列 N(1 ≤ N ≤ 10 月,| A i | ≤ 2.10 9)和数量 K(1 ≤ K ≤ N)。找出乘积最大的 K
考虑一个大小为 48x16 的 float 矩阵 A 和一个大小为 1x48 的 float vector b。 请建议一种在常见桌面处理器 (i5/i7) 上尽可能快地计算 b×A 的方法。 背景。
假设我有一个 class Rectangle(object): def __init__(self, len
设 A 为 3x3 阶矩阵。判断矩阵A的 boolean 积可以组成多少个不同的矩阵。 这是我想出的: #include int main() { int matri
背景 生成随机权重列表后: sizes = [784,30,10] weights = [np.random.randn(y, x) for x, y in zip(sizes[:-1],sizes[
我正在开发一个 python 项目并使用 numpy。我经常需要通过单位矩阵计算矩阵的克罗内克积。这些是我代码中的一个相当大的瓶颈,所以我想优化它们。我必须服用两种产品。第一个是: np.kron(n
有人可以提供一个例子说明如何使用 uBLAS 产品来乘法吗?或者,如果有更好的 C++ 矩阵库,您可以推荐我也欢迎。这正在变成一个令人头疼的问题。 这是我的代码: vector myVec(scala
我正在尝试开发一个Javascript程序,它会提示用户输入两个整数,然后显示这两个整数的和、乘积、差和商。现在它只显示总和。我实际上不知道乘法、减法和除法命令是否正在执行。这是 jsfiddle 的
如何使用 la4j 计算 vector (叉)积? vector 乘积为 接受两个 vector 并返回 vector 。 但是他们有scalar product , product of all e
在 C++ 中使用 Lapack 让我有点头疼。我发现为 fortran 定义的函数有点古怪,所以我尝试在 C++ 上创建一些函数,以便我更容易阅读正在发生的事情。 无论如何,我没有让矩阵 vecto
是否可以使用 Apple 的 Metal Performance Shaders 执行 Hadamard 产品?我看到可以使用 this 执行普通矩阵乘法,但我特别在寻找逐元素乘法,或者一种构造乘法的
我正在尝试使用 open mp 加速稀疏矩阵 vector 乘积,代码如下: void zAx(double * z, double * data, long * colind, long * row
有没有一种方法可以使用 cv::Mat OpenCV 中的数据结构? 我检查过 the documentation并且没有内置功能。但是我在尝试将标准矩阵乘法表达式 (*) 与 cv::Mat 类型的
我是一名优秀的程序员,十分优秀!