gpt4 book ai didi

ios - vImage 具有与带 dispatch_apply 的普通循环相同的性能

转载 作者:塔克拉玛干 更新时间:2023-11-02 09:42:32 26 4
gpt4 key购买 nike

此代码每次都在嵌套循环中运行 9600 次,并且在 iPhone4S 上的总运行时间必须低于 30 毫秒:

vImage_Buffer source = { sourceArea.data, patchSide, patchSide, patchSide };
vImage_Buffer destination = { (uchar*)malloc(patchSide * patchSide * sizeof(uchar)), patchSide, patchSide, patchSide };
vImage_AffineTransform transform = { warpingMatrix(0,0), warpingMatrix(0,1), warpingMatrix(1,0), warpingMatrix(1,1), 0, 0 };

if (vImageAffineWarp_Planar8(&source, &destination, NULL, &transform, 0, kvImageBackgroundColorFill) != kvImageNoError)
{
NSLog(@"Error in warping!");
}

它似乎没有那么快,因为 10x10 的补丁大约需要 0.0002 秒。我是否忽略了一些重大的性能错误?

我要解决的问题是后向扭曲图像的匹配,这是第一步。补丁在围绕一个点的 64 个不同位置扭曲 64 次,每个最多 150 个点。

最佳答案

10x10 是一个非常小的图像。您很容易将大部分时间花在开销/malloc 上。仪器时间跟踪应该有助于确定时间的去向。

4s 上的向量 ALU 的宽度也是 5 或 5s 的一半,因此与标量相比并没有那么大的优势。

关于ios - vImage 具有与带 dispatch_apply 的普通循环相同的性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25337267/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com