algorithm - 图像识别的起点？-6ren

algorithm - 图像识别的起点？

转载作者：塔克拉玛干更新时间：2023-11-03 05:01:25

26

4

我有一组 274 张彩色图像(每张都是 200x150 像素)。每个图像在视觉上都是不同的。我想构建一个应用程序，它接受一个基本图像集的放大/缩小版本并确定最接近的匹配。

我是一名高级软件工程师，但对图像识别完全陌生。我非常感谢关于从哪里开始的任何建议。

最佳答案

如果您要比较极其相似的图像，理论上计算两幅图像之间的欧氏距离就足够了。图像必须具有相同的大小才能这样做，因此通常需要重新缩放图像才能这样做(通常较大的图像会按比例缩小)。注意 aliasing这里可能会出现问题，因此请注意您的 downsampling algorithm .如果您的图片没有相同的宽高比，也会出现问题。

但是，这在实践中几乎从来没有做过，因为它非常慢。对于尺寸为 WxH 和 3 个颜色 channel 的 N 张图像，它需要 N x W x H x 3 次比较，这很快就会变得不可行(考虑到许多用户可以拥有超过 1000 张尺寸 >1000x1000 的图像)。

通常我们会尝试将图像缩小为更小的阵列，以更简洁地捕获图像信息，称为 visual descriptor .例如，将一张 1024x1024x3 的图像缩减为 128 长度的矢量。这只需要为引用图像计算一次，然后存储在适当的数据结构中。然后我们可以将查询图像的描述符与引用图像的描述符进行比较。

对于长度为 L 的描述符，为我们的 N 张图像数据集计算距离的成本是 N x L 而不是原来的 N x W x H x 3

因此，问题是要找到高效的描述符，这些描述符 (a) 计算成本低且 (b) 准确捕获图像。这仍然是一个活跃的研究领域，但我可以提出一些建议:

直方图可能是执行此操作的最简单方法，尽管它们对任何光照变化的效果都非常差，并且仅包含颜色信息，没有空间信息。确保在进行任何比较之前对直方图进行归一化
感知散列适用于非常相似的图像或略微裁剪的图像。参见 here
GIST 描述符功能强大，但更复杂，参见 here

关于algorithm - 图像识别的起点？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34417244/

26

4

0

文章推荐： c - ANN : Learning Vector Quantization not working

文章推荐： java - 将 UUID 转换回字符串输入 - nameUUIDFromBytes

文章推荐： c# - 算法 - 生成从大量列表中选择一个元素的所有组合

Javascript 起点
有没有办法让我的浏览器告诉我当我点击一个 div 时执行的第一个 JavaScript 是什么。让我分解一下: 代码示例: Hi There jQuery('hello').bind('clic
algorithm - A* 算法 - 起点
我在一个二维网格迷宫中，你只能水平和垂直移动。边成本为 1，我使用曼哈顿距离来估计从节点到目标的距离。我的问题是，如果您从当前节点开始寻找到达目标的路径，或者从目标节点开始并找到返回当前节点的路径，
Android - SeekBar 起点
我的 View 中有两个 SeekBar，我在布局中类似地声明了它们: 这是我使用它们的代码: SeekBar sb = (SeekBar) v.findViewByI
Java EE TDD 起点
我想将 TDD 应用于我的 Java EE 应用程序。要求是创建一家具有名称和联系方式的公司。系统的入口点是Rest和Web服务，取决于客户端。我正在努力寻找编写单元测试的起点。我应该从无状态的
flutter - 如何设置 Flutter showMenu 起点
我想知道如何改变popUpMenu的原点，在底部应用栏正上方启动弹出窗口，无论项目数如何。与屏幕右端对齐。类似的东西(例如) Positioned(right: 0, bottom: bottomAp
unit-testing - 如何在实际项目中选择 TDD 起点？
我已经阅读了大量文章，看过大量关于 TDD 的截屏视频，但我仍在努力在实际项目中使用它。我的主要问题是我不知道从哪里开始，第一个应该是什么测试。假设我必须编写调用外部系统方法(例如通知)的客户端库。
asp.net - .NET 中社交网站的框架/起点？
我确实在这个网站上进行了一些谷歌搜索，但没有找到我想要的东西。我希望有人能在这里为我指出正确的方向。我是一名 ASP.NET/SQL Server 开发人员，希望开发一个(最初)基本社交网站 (ga
javascript - jQuery 插件 TDD 起点
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭 5 年前。
api - 使用 API key 开发服务(起点)
google了一下，没有找到任何东西。有什么好的资源可以帮助我开始为严重依赖 API key 的 RESTless Web 应用程序设计后端。我知道如何编写不稳定的网络服务等，只是从未使用过 AP
c++ - 在 C++ 中确定 getline() 起点
这是我的代码的一部分 string line; ifstream file ("Names.txt"); int i; for (i = 0; i < line.length(); ++i) {
android - 如何获取从位置A(起点)到位置B(目的地)的路线的所有经纬度
我已经尝试创建路线，但我不确定如何事先获取从起点到目的地的所有纬度和经度。在这里，当我在 map 中搜索从起点到终点的路线时，我选择了一条我选择的路线，我想获得从起点到终点的所有经纬度。我必须将这些数
ios - Xcode Swift SKAction.follow 起点
我正在尝试让宇宙飞船绕行星运行。我目前正在做 let playerPos = player.position let planetPos = planet.position let radius =
python - 如何在 Django 模板中设置自定义 forloop 起点
Java 中有一个 forloop，我可以在其中判断从哪里开始和从哪里结束: for(int i=10;i{{ athlete.name }} {% endfor %} {{forloop.last=
c# - 如何在 dot net core 中设置默认文件(起点)
我正在尝试探索 dot net 核心功能以更好地理解它，因为我执行了同样的操作 dotnet new dotnet build dotnet run 命令提示符窗口中的命令，它为我创建了一个项目并创建
javascript - 以任意 Angular 移动移动物体上的 X 和 Y 起点
我正在使用 HTML5 Canvas 和 JavaScript 开发一款游戏。这是一款简单的太空射击游戏，屏幕中央有一门大炮。我可以旋转大炮并以与大炮方向相同的 Angular 发射导弹。但我有一个
java - 为什么 Css 特定的边框样式(如脊线、凹槽、起点、插图)在 javafx 中不起作用？
我正在尝试通过在 JavaFX 应用程序中使用凹槽、脊线边框样式来获得 3d 外观。但它正在向我展示 Unsupported 'groove' while parsing '-fx-border-s
hadoop - Streamsets Mapr FS 起点/终点。 KerberosPrincipal 异常(使用 hadoop 模拟(在 mapr 6.0 中))
我正在尝试从 mapr fs origin 进行简单的数据移动到 mapr fs destination (这不是我的用例，只是为了测试目的做这个简单的 Action )。尝试 validate 时这

首页

博学

6Ren·AI

商城

algorithm - 图像识别的起点？