gpt4 book ai didi

c++ - 我如何识别具有不同尺寸的重复图像

转载 作者:行者123 更新时间:2023-11-30 03:27:47 26 4
gpt4 key购买 nike

问题是我有一个包含超过 80k 图像的文件夹,其中大约 40% 是重复的。 (有些图片旋转了,有些尺寸不同,但仍然是同一张图片)。

起初我使用散列算法(使用 c++/java)来删除所有重复的图像(具有相同的大小和其他属性)。但它似乎并没有删除所有这些,因为有些图片有不同的尺寸(但在视觉上是相同的)

我在网上搜索了很多,想找到解决这个问题的任何有效算法

我找到的解决我的问题的最佳代码是 pHash,但它已经过时并且不再适用于 VS。

如果有人对我有想法,那就太棒了。

谢谢

最佳答案

除了哈希算法,你还可以计算histogram对于每个图像,然后是 compare them

在旋转的图像中,直方图应该完全相同,对于调整大小的图像,它应该非常相似。

Here有一个使用 OpenCV 进行直方图比较的示例。

我仍然建议首先使用哈希,因为它应该更快并删除第一组重复项,然后使用直方图比较对其进行优化。

关于c++ - 我如何识别具有不同尺寸的重复图像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47064837/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com