- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我有一个大图像,其中包含背景上感兴趣的“ Blob ”。我有所有 Blob 的位置(质心、边界框、区域)。我想在图像中裁剪出有限数量的固定大小的区域,以便捕捉大部分 Blob 。以下示例针对同一图像中的 1、2 或 3 个裁剪区域。
此示例表明裁剪 1 个区域(红色)相对容易:只需选择具有尽可能多 Blob 的区域即可。这可以通过尝试所有方法或可能通过使用核密度估计器或类似方法计算 Blob 密度来解决。
但裁剪 2 个区域(蓝色虚线)不仅仅是在上面第一个选择之后裁剪下一个最佳裁剪区域。这是一个新问题,我需要找到 2 种裁剪的最佳组合。尝试 2 种裁剪的所有组合(蛮力)可能会变得计算成本太高(我有很多图像要处理,而且它们很大)。
同样,裁剪 3 个区域(绿色)是一个新问题,而且是一个更不适合暴力破解的问题。在该特定示例中,3 个区域中的 2 个与蓝色情况相同,并添加了一个新区域,但这不是一般情况(我只是想展示一个稍微复杂的场景)。
我不知道解决 n-crops 案例的算法。我想知道这个问题是否有理论上/众所周知的解决方案。
另外:
提前感谢您的指点。
PS:编码语言在这里并不重要,因为算法的核心(根据 Blob 的位置/大小找到裁剪的最佳位置)只需要小数组(每个图像的位置/大小约为 100 个 Blob )进行计算。我可能会使用 Python 或 R。
最佳答案
如果 Blob 相对较小,如图所示,您可以使用 Blob 中心 x,y 对运行 k-Means 聚类。python scikit-learn 包非常成熟,应该运行良好:http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html (KMeans分类器的函数fit_predict)
k 是一个输入,表示您想要的簇数。该算法会将 blob(样本)拆分为 k 个簇(集)。然后,您可以计算每个集合的 x、y 帧(min-x、max-x、min-y、max-y),还可以包括 blob 的各个大小,或者如果它们相当小,则只取它们的最大值。
然后您可以根据它们的 #blobs/frame-area 比率对簇进行排序,然后将它们相加,例如直到足够多的 Blob 被覆盖(完成) - 或者你的总面积变得太大(在这种情况下用更大的 k 重新运行)。
关于python - 最佳放置裁剪区域以捕获图像中的特征( Blob )的算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29776583/
语句 1: [2,4,6,7,8].each do |i| (i % 2 == 0) || (puts "Not even" && break) puts i end 声明 2: [2
我有一张正在显示的卡片,上面有一些信息。我想将其包装在SingleChildScrollView中,因为我还有更多项目要添加到卡中,但是当我这样做时,屏幕只是空白吗?我曾尝试将其作为根(脚手架主体)放
我有一个带有窗体的 View ,该窗体显示ViewModel中ObservableCollection中对象的数据。 ObservableCollection使我可以浏览数据。 ObservableC
如何将时间戳附加文件名放在HDFS中? hadoop fs -put topic_2018-12-15%2016:31:15.csv /user/file_structure/ 最佳答案 您只是在运行
我正在寻求一些帮助,以找出为什么以下叠加函数的运行时间会随着每次连续运行而增加。 据我所知,如果缓冲区中的文本保持不变,则运行时间应该是相同的——即,仅向左/向右移动光标应该不会增加运行时间(但它确实
我有一个事件指示器,它显示在中间。如何将其放置在 View 的左上角? var activityIndicator = UIActivityIndicatorView() func show() {
首先,我想提前感谢所有回答这个问题的人。非常感谢您的帮助。这是我第一次在这里发帖,所以如果我发帖不礼貌,请原谅我。 我的问题是关于方法原型(prototype)的: void copySubtree(
我正在开发一个应该是通用的应用程序,一个适用于 iPad 和 iPhone 的应用程序。我想让他们的界面尽可能相似。在 iPhone 应用程序中,我使用的是选项卡栏 Controller ,其中一个选
我目前正在使用 JS 开发 REST API,但遇到以下问题:该代码有效,但如果我尝试删除、放置或修补不存在的条目,它不会返回错误,但会打印成功消息。这是为什么?获取路由完美运行。 app.route
.a{ width:500px; height:500px; background:yellow; border: 3px dashed black; }
首先,请引用下图: 这基本上是我对布局的想法。 我想要的是: 内容 div 成为“主要焦点”,例如当浏览器 调整大小,它应该留在中间; 当浏览器被调整大小时,我希望这两个图像基本上 位于内容 div
我的应用程序需要使用内存映射并发访问数据文件。我的目标是使其在共享内存系统中可扩展。研究了内存映射文件库实现的源码,想不通: 在多个线程中从 MappedByteBuffer 中读取是否合法? get
我有一个 JDesktopPane 并希望以网格样式显示 JInternalFrames 而无需覆盖框架。框架的尺寸会有所不同,因此应动态分配它们的位置。我可以存储最后放置的框架的坐标,但可以移动、最
根据https://isocpp.org/wiki/faq/dtors#placement-new传递给placement-new的地址必须正确对齐。但它给出的例子似乎与此相矛盾。 char memo
我最近一直在查看 Illumos 源代码,发现了一些奇怪的东西。 在他们的源代码中,函数类型是这样写的: static int outdec64(unsigned char *out, unsigne
您好,我目前正在尝试在我的一张图片旁边放置一个图例,但我在放置时遇到了问题。 我想将图例放在图像的左侧或右侧。这是我当前的代码: .my-legend .legend-title { text-a
根据文档, print 之间的唯一区别和 say 似乎是后者添加了 "\n"(并使用 .gist 进行字符串化)。然而, perl6 -e 'print "del\b\b"' 打印“d”,有效地应用转
所以我试图将我的图像标志放在背景上,但我的背景突然被裁剪,出现了一半的黑屏。如图: 我的 main.dart 代码: import 'package:flutter/material.dart'; i
我正在使用 Azure DevOps 构建 python 轮。我想让它尽可能通用,以便团队中的每个人都可以使用相同的管道来构建自己的 python 轮并将它们部署在一些 databricks 工作区中
在构建标准(非 WordPress)网页时,我通常会在正文末尾之前加载所有 javascript 文件,然后包含页面特定 js 代码的部分。 WorPress 建议使用 wp_enqueue_scri
我是一名优秀的程序员,十分优秀!