gpt4 book ai didi

c - 基于英特尔的 DCT 硬件加速?

转载 作者:太空宇宙 更新时间:2023-11-04 02:15:11 27 4
gpt4 key购买 nike

我们正在编写针对某些 Intel 硬件的图像处理算法。通常我们更喜欢通用的 C 实现,但我们已经确定了一种算法,其核心执行大量离散余弦变换 (DCT),效果非常好。不幸的是,我们的吞吐量要求使得通用 C 实现大约慢 2 个数量级。我可以通过一些其他技巧获得一个数量级,所以如果我可以将我的 DCT 提高大约一个数量级,我就有了通往成功的道路。

英特尔 MMX 是一种获得硬件加速以执行这些 DCT 的方法吗?我可以利用其他英特尔特定的库和/或硬件来加快这些坏男孩的速度吗?

我从哪里开始看?这对我来说是一份新工作,也是我第一次深入研究英特尔硬件,因此非常感谢任何指点。

最佳答案

看看英特尔的 Integrated Performance Primitives图书馆。它包含大量例程,这些例程经过大量优化以使用 Intel 架构,特别是 MMX 和 SSE。除其他外,IPP 还包含 DCT 例程 ( documentation here )。

关于c - 基于英特尔的 DCT 硬件加速?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8930644/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com