- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我的目的是比较两个图像之间的像素并找出最小(优化)包含图像之间所有不同像素的矩形区域。简单地说,我比较了两个图像的所有像素(例如1024 * 768像素)并发现了不同的部分,但由于速度原因这不是个好主意。我需要每秒至少进行十五次比较。你知道更有效的算法吗?
最佳答案
从一张图片中减去另一张图片。相同的像素将变为零,即黑色。
找到一个黑色的角并使用 trim
(修剪边框/边缘)类型的命令修剪黑色边框,它会告诉您差异区域。
如果您可以使用它,只需两行 ImageMagick 就可以非常简单地完成它 - 它可以在许多平台上用于 C/C++、Python、Perl...
让我们拍两张图片,a.jpg
和 b.jpg
:
你看到我在那里做了什么吗? :-)
现在我们可以使用 ImageMagick 来找出差异和不同的区域。我正在使用命令行,但正如我所说,您可以使用 C/C++、Perl、Python、.NET 或任何您喜欢的东西。
要么用这个来找出不同点:
convert a.jpg b.jpg \
-compose difference \
-composite \
-threshold 0 \
-separate \
-evaluate-sequence Add \
diff.jpg
这给出了这个:
或者使用这个:
composite a.jpg b.jpg -compose difference diff.jpg
这给出了这个:
或者用它做一个简单的减法:
convert a.jpg b.jpg -compose minus -composite diff.jpg
现在您可以使用 ImageMagick 的 border-trim 函数来评估如果您修剪掉所有黑色边框会剩下什么,如下所示:
convert a.jpg b.jpg \
-compose difference \
-composite \
-threshold 0 \
-separate \
-evaluate-sequence Add \
-format "%w %h %@" \
info:
输出这个:
400 463 264x240+80+176
告诉您图像是 400x463,如果您裁剪边框,您将留下一个 264x240 的矩形,其左上角像素从图像左上角偏移 80,176。
为了好玩,我将使用以下命令将该矩形绘制到红色图像上:
convert diff.jpg \
-stroke red \
-fill transparent \
-draw "rectangle 80,176 344,416" \
rect.jpg
这给出了这个:
基本上,您可以在一两行 shell 或 8-10 行 C/C++ 中完成我在此处解释的所有操作。请注意,边界框略大,因为我叠加的卡通具有透明的矩形背景。如果您需要在差异中允许一定程度的“草率”,您还可以使用 -fuzz 5%
允许图像中的细微差异。
另一种检测边界框的方法是挤压差异图像直到它是一个高图像,只有一个像素宽,如下所示:
convert diff.jpg -scale 1x! -threshold 1% t.jpg
结果如下图:
现在,如果您将输出转换为文本格式,您可以轻松找到第一个白色像素(您不会在程序中这样做——您会编写一个循环来代替——但我在这里展示了这个概念):
convert diff.jpg -scale 1x! -threshold 1% txt: | grep -m1 white
0,176: (255,255,255) #FFFFFF white
grep -m1 white
查找其中包含 white
的第一行,然后停止查找(匹配限制为 1)。这表明第一行有一个白色像素是 176 - 与上面的红色框比较。现在我们可以找到最后一个白色像素,使用:
convert diff.jpg -scale 1x! -threshold 1% txt: | grep white | tail -1
0,415: (255,255,255) #FFFFFF white
我们知道第 415 行是边界框的底部。
现在您将图像压缩成一个只有 1 像素高的宽平面版本,并找到边界框的左右边界:
convert diff.jpg -scale x1! -threshold 1% txt: | grep -m1 white
80,0: (255,255,255) #FFFFFF white
convert diff.jpg -scale x1! -threshold 1% txt: | grep white | tail -1
343,0: (255,255,255) #FFFFFF white
所以你的边界框的左右限制是 80 和 343 - 根据红色矩形。
关于algorithm - 查找两个图像之间的不同区域,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26609395/
我有 table 像这样 -------------------------------------------- id size title priority
我的应用在不同的 Activity (4 个 Activity )中仅包含横幅广告。所以我的疑问是, 我可以对所有横幅广告使用一个广告单元 ID 吗? 或者 每个 Activity 使用不同的广告单元
我有任意(但统一)数字列表的任意列表。 (它们是 n 空间中 bin 的边界坐标,我想绘制其角,但这并不重要。)我想生成所有可能组合的列表。所以:[[1,2], [3,4],[5,6]] 产生 [[1
我刚刚在学校开始学习 Java,正在尝试自定义控件和图形。我目前正在研究图案锁,一开始一切都很好,但突然间它绘制不正确。我确实更改了一些代码,但是当我看到错误时,我立即将其更改回来(撤消,ftw),但
在获取 Distinct 的 Count 时,我在使用 Group By With Rollup 时遇到了一个小问题。 问题是 Rollup 摘要只是所有分组中 Distinct 值的总数,而不是所有
这不起作用: select count(distinct colA, colB) from mytable 我知道我可以通过双选来简单地解决这个问题。 select count(*) from (
这个问题在这里已经有了答案: JavaScript regex whitespace characters (5 个回答) 2年前关闭。 你能解释一下为什么我会得到 false比较 text ===
这个问题已经有答案了: 奥 git _a (56 个回答) 已关闭 9 年前。 我被要求用 Javascript 编写一个函数 sortByFoo 来正确响应此测试: // Does not cras
所以,我不得不说,SQL 是迄今为止我作为开发人员最薄弱的一面。也许我想要完成的事情很简单。我有这样的东西(这不是真正的模型,但为了使其易于理解而不浪费太多时间解释它,我想出了一个完全模仿我必须使用的
这个问题在这里已经有了答案: How does the "this" keyword work? (22 个回答) 3年前关闭。 简而言之:为什么在使用 Objects 时,直接调用的函数和通过引用传
这个问题在这里已经有了答案: 关闭 12 年前。 Possible Duplicate: what is the difference between (.) dot operator and (-
我真的不明白这里发生了什么但是: 当我这样做时: colorIndex += len - stopPos; for(int m = 0; m < len - stopPos; m++) { c
思考 MySQL 中的 Group By 函数的最佳方式是什么? 我正在编写一个 MySQL 查询,通过 ODBC 连接在 Excel 的数据透视表中提取数据,以便用户可以轻松访问数据。 例如,我有:
我想要的SQL是这样的: SELECT week_no, type, SELECT count(distinct user_id) FROM group WHERE pts > 0 FROM bas
商店表: +--+-------+--------+ |id|name |date | +--+-------+--------+ |1 |x |Ma
对于 chrome 和 ff,当涉及到可怕的 ie 时,这个脚本工作完美。有问题 function getY(oElement) { var curtop = 0; if (oElem
我现在无法提供代码,因为我目前正在脑海中研究这个想法并在互联网上四处乱逛。 我了解了进程间通信和使用共享内存在进程之间共享数据(特别是结构)。 但是,在对保存在不同 .c 文件中的程序使用 fork(
我想在用户集合中使用不同的功能。在 mongo shell 中,我可以像下面这样使用: db.users.distinct("name"); 其中名称是用于区分的集合字段。 同样我想要,在 C
List nastava_izvjestaj = new List(); var data_context = new DataEvidencijaDataContext();
我的 Rails 应用程序中有 Ransack 搜索和 Foundation,本地 css 渲染正常,而生产中的同一个应用程序有一个怪癖: 应用程序中的其他内容完全相同。 我在 Chrome 和 Sa
我是一名优秀的程序员,十分优秀!