gpt4 book ai didi

optimization - 范围编码器 : How to get rid of divisions?

转载 作者:行者123 更新时间:2023-12-03 17:08:08 27 4
gpt4 key购买 nike

我正在尝试优化 QTC视频编解码器可以在 Raspberry Pi 上运行并具有不错的性能。一个重要的瓶颈是在范围解码器中完成的 32 位整数除法,它占用了 18% 的解码时间。由于设备的 ARM 处理器显然缺少整数除法指令,我认为可以轻松优化它。划分必须准确。

那个特定除法中的被除数和除数每次调用都是不同的,但众所周知,除数总是小于 65536。我考虑过构建一个反除数值的查找表。使用该表我可以使用乘法而不是除法。查找表的大小为 256 KB。

问题

  1. 执行该优化是个好主意吗?
  2. 是否有更好的方法摆脱软件部门?
  3. 是否有不同的方法来实现不除法的算法?
  4. 其他想法?

最佳答案

人们还可以利用这一事实,即 Raspberry Pi 包含一个能够执行 double FP 除法的 FP 单元,这比整数除法的软件仿真更快。将所有整数除法 a = b/c 替换为 a = (double)b​​/(double)c 对我有用。

关于optimization - 范围编码器 : How to get rid of divisions?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11787006/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com