- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我目前正在使用 vDSP 框架中的一些函数,尤其是 vDSP_conv,我想知道是否有任何方法可以检查该函数是调用标量模式还是在 neon 处理器上处理 SIMD。
documentation该函数的部分提到了必须满足或调用标量模式的 power-pc-architecture 的一些标准。现在我既不知道这些标准是否也适用于 iphone,也不知道如何检查我的函数是否调用标量模式或在 neon 上正常运行。
有没有办法检查这个?
谢谢!
最佳答案
NEON 代码用于 vDSP_conv 实现。它在某些情况下使用,而在其他情况下不使用。
我们(生产 vDSP 的 Vector and Numerics Group)并未发布关于哪些函数使用 NEON 的标准,部分原因是存在许多复杂因素:每个调用的细节(步幅、长度和多个参数的对齐方式) 、执行代码的处理器型号和软件版本。
如果您对具体案例有疑问,我可以进行调查。
您是出于好奇而问,还是表现不尽如人意?通常,潜在的关注点是实现的执行速度以及它是否可以更好。 SIMD 可能是其中一些的代理,但它不是实际目标。
已更新以解决以下评论:
查看最新 iOS 的源代码,看起来在进行关联时您需要获取 SIMD 代码的所有内容是在具有 NEON 的处理器上执行并将所有步幅设置为 1。但是,该代码专门用于使用对齐提示如果地址对齐,那么如果您将信号、滤波器和输出地址安排为 16 字节的倍数,您可能会在某些处理器型号上获得更好的性能。如果可以,请使用八的倍数作为过滤元件的数量,但四的倍数也不错。
不幸的是,代码不是O(n•log(n));它使用直接算术而不是 FFT 实现,所以它是 O(n2)。通常,它是为较短的长度而设计的,在这种情况下直接算术是合适的。如果用于相关的 FFT 算法对您有帮助,请在 https://bugreport.apple.com 提交功能请求。 .
无论使用何种算法,如果您想要独立于长度的相同信息,较短的长度并不是更好。这是因为,如果您处理较短的长度,则必须以各种组合方式处理更多的长度才能获得相同的信息。我希望设计是找出您需要的长度,以便相关性产生您需要的信息,然后使用该长度而不对其进行分割。
关于iphone - 如何检查 vDSP 函数是否在 neon 上运行标量或 SIMD,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13809552/
Perl 中的标量是一个简单的数据单元 标量的值可以是一个整数,浮点数,字符,字符串,段落或者一个完整的网页 范例 : Perl 中标量的使用 #!/usr/bin/perl =pod
This question already has answers here: Querying Spark SQL DataFrame with complex types (3个答案) 2年前关闭
我有一个非常基本的问题,找不到解决方案,因此对于初学者的问题,请提前抱歉。 我有一个包含多个 ID 列和 30 个数字列的数据框。我想用相同的因子乘以这 30 列的所有值。我想保持数据框的其余部分不变
我想使用 UUID 作为标识符,但标准标量 ID 被强制转换为字符串。所以在我使用 ID 类型的任何地方都必须从字符串中解析 uuid。 我想知道是否可以用我自己的实现覆盖 ID 类型?这个标量类型有
我有一个函数数组farr,比如说 import numpy as np farr=np.array([(lambda x, y: x+y) for n in range(5)]) (实际上,函数都是不
请帮助我理解以下片段: my $count = @array; my @copy = @array; my ($first) = @array; (my $copy = $str) =~ s/\\/\
我有一个程序,我一直在玩弄,我偶然发现了这样的东西: unsigned char tmp[4]; ... if (mpu_write_mem(D_1_36, 2, tmp+2)) return
我需要很大的帮助,请查看这段代码: import.math dose =20.0 a = [[[2,3,4],[5,8,9],[12,56,32]] [[25,36,45][21,65,98
我要设计一个类PrimitiveType它作为标量、 vector 、张量等数学实体的抽象类,将它们存储在 std::vector myVector 中。我可以通过它进行迭代。例如,有两个相同大小的
这个问题在这里已经有了答案: int a = 0 and int a(0) differences [duplicate] (7 个答案) 关闭 3 年前。 据我所知在C++中是一个初始化的形式 T
perl 代码如下:问题是我无法读取 sub tweak_server{} 中的 $key .... my $key; my %hash = ( flintstones => [ "C:/Users1
我正在尝试使用 symfony3 连接到数据库,但问题是当我将密码放入parameters.yml 中时,出现此错误: 数据库密码:xx%xxxxx%x You have requested a no
我正在寻找 pd.cut 的等价物,但要寻找标量? 我想这样做: bins = [0, 5, 10, 15, 20, 25, 30, 40, 50, 100, 150] pd.cut(43, bins
到目前为止,我在互联网上找到的唯一帮助是 this blog .我认为这会让我到达那里,但我认为它实际上并没有改变我模块中的值。我做了一个示例来说明我的意思。 package Module; use
我盯着 perl LWP::Protocol.pm 中的这段代码,我不明白循环将如何退出: while ($content = &$collector, length $$content) {
两年来,我正在开发一个库:cyme通过“友好容器”执行 SIMD 计算。我能够达到处理器的最大性能。通常用户定义容器并根据以下语法编写内核(简单示例): for(i...) W[i] = R[i]
我正在开发一个 OpenCL 程序,但每次执行的输出都不同。我认为这与将参数传递给内核有关,因为当我对特定执行的值进行硬编码时,每次执行后的输出都是相似的。 我的内核看起来像这样: __kernel
我想在服务类中返回 JSON 文字 @GraphQLQuery(name = "renderUI", description = "Schema for your form") public Stri
我有一个使用 PDL 的函数.最后一步是点积,因此它返回一个标量。但是,当我尝试打印这个标量时,它显然仍然是一个小玩意,并在屏幕上打印如下: [ [ 3 ] ] 我想知道如何将它转换回常规的 Pe
首先,如果我的问题很简单,我深表歉意。我确实花了很多时间研究它。 我正在尝试在 PySpark 脚本中设置标量 Pandas UDF,如所述 here . 这是我的代码: from pyspark i
我是一名优秀的程序员,十分优秀!