gpt4 book ai didi

iphone - 如何检查 vDSP 函数是否在 neon 上运行标量或 SIMD

转载 作者:塔克拉玛干 更新时间:2023-11-02 09:03:53 24 4
gpt4 key购买 nike

我目前正在使用 vDSP 框架中的一些函数,尤其是 vDSP_conv,我想知道是否有任何方法可以检查该函数是调用标量模式还是在 neon 处理器上处理 SIMD。
documentation该函数的部分提到了必须满足或调用标量模式的 power-pc-architecture 的一些标准。现在我既不知道这些标准是否也适用于 iphone,也不知道如何检查我的函数是否调用标量模式或在 neon 上正常运行。

有没有办法检查这个?
谢谢!

最佳答案

NEON 代码用于 vDSP_conv 实现。它在某些情况下使用,而在其他情况下不使用。

我们(生产 vDSP 的 Vector and Numerics Group)并未发布关于哪些函数使用 NEON 的标准,部分原因是存在许多复杂因素:每个调用的细节(步幅、长度和多个参数的对齐方式) 、执行代码的处理器型号和软件版本。

如果您对具体案例有疑问,我可以进行调查。

您是出于好奇而问,还是表现不尽如人意?通常,潜在的关注点是实现的执行速度以及它是否可以更好。 SIMD 可能是其中一些的代理,但它不是实际目标。

已更新以解决以下评论:

查看最新 iOS 的源代码,看起来在进行关联时您需要获取 SIMD 代码的所有内容是在具有 NEON 的处理器上执行并将所有步幅设置为 1。但是,该代码专门用于使用对齐提示如果地址对齐,那么如果您将信号、滤波器和输出地址安排为 16 字节的倍数,您可能会在某些处理器型号上获得更好的性能。如果可以,请使用八的倍数作为过滤元件的数量,但四的倍数也不错。

不幸的是,代码不是O(n•log(n));它使用直接算术而不是 FFT 实现,所以它是 O(n2)。通常,它是为较短的长度而设计的,在这种情况下直接算术是合适的。如果用于相关的 FFT 算法对您有帮助,请在 https://bugreport.apple.com 提交功能请求。 .

无论使用何种算法,如果您想要独立于长度的相同信息,较短的长度并不是更好。这是因为,如果您处理较短的长度,则必须以各种组合方式处理更多的长度才能获得相同的信息。我希望设计是找出您需要的长度,以便相关性产生您需要的信息,然后使用该长度而不对其进行分割。

关于iphone - 如何检查 vDSP 函数是否在 neon 上运行标量或 SIMD,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13809552/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com