作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我在 ADI 公司的 Sharc DSP 处理器上有一个 32 位 C++ DSP 音频处理项目,需要将其移至 64 位处理,该项目现在已可用于 ARM AArch64 的嵌入式用例。
我正在考虑两种选择:
arm_biquad_cascade_df2T_f64()
(它实际上与补充 init 函数一起工作,该函数实现了以基于块的方式处理数据所需的状态数组)。库 funcs 似乎适用于 64 位。但我怀疑它们是否适合 AArch64 并针对 AArch64 进行了优化,因为通常 CMSIS 标记为 32 位,类似的 Ne10。
最佳答案
如果您有选择,为了性能,您肯定希望选择 AArch64 而不是 32 位 Neon 实现。 AArch64 有更多/更宽的 vector 寄存器。并且 CPU 从乱序执行中获益更多,因为 AArch64 放弃了 32 位指令集无处不在的条件执行,这很容易通过条件标志导致指令之间的额外依赖。
我个人最近从一个特定的优化任务中得出的结论:
-Rpass=loop-vectorize -Rpass-missed=loop-vectorize -Rpass-analysis=loop-vectorize
关于c++ - Neon/RPi 上的 64 位 DSP 滤波性能优化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64115868/
我正在执行以下操作:执行 FFT/削减 FFT 结果中高于 100Hz 的每个频率/执行逆 FFT 如果原始数据集没有偏移量,它效果很好!如果它有偏移,则输出结果幅度会被损坏。 示例: Without
我从这里得到了 Bw BP C 代码,https://www-users.cs.york.ac.uk/~fisher/mkfilter ,正如其他操作系统主题中所评论的那样,并进行了 250Hz,第
我想使用窗口函数制作一个 FIR 滤波器。我有一些样本数据,size 变量是样本数。 windowSize 变量是窗口函数的大小。首先我创建窗口函数(blackman 窗口):变量 window然后我
我是一名优秀的程序员,十分优秀!