gpt4 book ai didi

algorithm - 计算图像之间的差异

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:15:55 26 4
gpt4 key购买 nike

你们知道有什么算法可以用来计算图像之间的差异吗?

以本网页为例http://tineye.com/你给它一个链接或上传一张图片,它会找到相似的图片。我怀疑它将有问题的图像与所有这些图像进行了比较(或者可能确实如此)。

我所说的计算是指 Levenshtein_distanceHamming distance用于字符串。

我绝对不需要项目或任何东西的正确答案,我只是找到了这个网站并且很好奇。我知道 digg 为其网站支付类似服务的费用。

最佳答案

最简单的措施将是基于 RMS 误差的方法,例如:

这些可能会与您的距离度量概念融为一体,但只有当您有两张已经非常接近的图像时,它们的结果才真正有意义,就像您正在查看特定压缩方案对原始图像的保留程度一样.此外,两种比较的相同结果可能意味着很多不同的事情,这取决于存在的伪影类型(看看我在下面引用的论文,一些 RMS/PSNR 示例照片可能会产生误导)。

除此之外,还有一个致力于图像相似性的研究领域。我不是专家,但这里有几点建议:

  • 大量工作已投入到使用 dimensionality reduction 的方法中(PCA、SVD、特征值分析等)来挑选图像的主要成分并在不同图像之间进行比较。

  • 其他方法(特别是医学成像)使用 segmentation技术来挑选图像的重要部分,然后他们根据找到的内容比较图像

  • 还有一些人试图设计相似性度量来绕过 RMS 误差和 PSNR 的一些缺陷。 spatial domain structural similarity (SSIM) 上有一篇很酷的论文措施,它试图模仿人们对图像错误的看法,而不是直接的、数学上的错误概念。同一个人使用 wavelet analysis 改进了平移/旋转不变版本在 this paper on WSSIM .

  • 看起来 TinEye 使用具有 很多 属性值的特征向量来进行比较。如果你在他们的网站上四处寻找,你最终会到达 Ideé Labs页,和 their FAQ有一些(但不是太多)关于算法的细节:

    问:视觉搜索如何工作?

    答:Idée 的视觉搜索技术使用复杂的算法来分析数百种图像属性,例如颜色、形状、纹理、亮度、复杂性、对象和区域。这些属性形成一个紧凑的数字签名,用于描述图像的外观每张图片和这些签名均由我们的软件计算并编制索引。在执行视觉搜索时,我们的搜索引擎会快速比较这些签名,以返回视觉上相似的结果。

这绝不是详尽无遗的(它只是我在自己的研究过程中遇到的少数技术),但如果你在谷歌上搜索技术论文或浏览最近的图像处理 session 论文集,你一定会为这个东西找到更多的方法。这不是一个已解决的问题,但希望这些指示能让您了解所涉及的内容。

关于algorithm - 计算图像之间的差异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/613146/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com