gpt4 book ai didi

image - 相似图片搜索解决方案

转载 作者:行者123 更新时间:2023-12-01 11:06:30 24 4
gpt4 key购买 nike

我的图像存储服务器有一个非常大的问题。

上面大约有​​ 2,000,000 张产品图片,并且还在不断增加,但其中有很多非常相似。例如:一张 iPad 照片有许多相似尺寸 120 * 120、118 * 120、131 * 125 ... 等。它们在我的网站上占用了大量不必要的磁盘空间和糟糕的用户体验(图库中的相似图片)。

那些图像已经在数据库中建立了索引,我可以通过一些条件找到它们,比如按产品、类别等。我需要找到一种方法来标记数据库中的这些相似图像并将它们删除。

我做了什么:发现一个叫pHash的库可以计算两张图片的相似度,我可以用它一张一张计算图片。但是这样的话,找到那些图像会花费很多时间。现在我不知道如何使这个过程更快。

有什么想法吗?

最佳答案

  • 使用 pHash 计算所有图像的感知哈希值(不是每个组合的叉积),
  • 然后对该散列进行排序(同时保留对图像的引用),
  • 然后定义您定义为“图片是等效的”的感知散列的临界值,
  • 然后将对等效图片的引用替换为对您要保留的一张照片的引用。

关于image - 相似图片搜索解决方案,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5257589/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com