gpt4 book ai didi

c++ - (opencv rc1) 是什么导致 Mat 乘法比每像素乘法慢 20 倍?

转载 作者:可可西里 更新时间:2023-11-01 17:57:37 44 4
gpt4 key购买 nike

// 700 ms
cv::Mat in(height,width,CV_8UC1);
in /= 4;

替换为

//40 ms
cv::Mat in(height,width,CV_8UC1);
for (int y=0; y < in.rows; ++y)
{
unsigned char* ptr = in.data + y*in.step1();
for (int x=0; x < in.cols; ++x)
{
ptr[x] /= 4;
}
}

什么会导致这种行为?是由于 opencv 将具有标量乘法的 Mat“提升”为具有 Mat 乘法的 Mat,还是针对 arm 的特定失败优化? ( NEON 已启用)。

最佳答案

这是一个非常老的问题(我几年前就报告过),许多基本操作都需要额外的时间。不仅仅是除法,还有加法、abs 等等……我不知道这种行为的真正原因。更奇怪的是,本应花费更多时间的操作,如 addWeighted,实际上非常高效。试试这个:

addWeighted(in, 1.0/4, in, 0, 0, in);

它对每个像素执行多个操作,但它的运行速度比添加函数和循环实现快几倍。

这是我的 report在错误跟踪器上。

关于c++ - (opencv rc1) 是什么导致 Mat 乘法比每像素乘法慢 20 倍?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30167044/

44 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com