- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正试图在这样的游戏屏幕中找到事件对象:
活跃意味着它们有一个灰白色的边框,所以这里是左上角的方 block 和中间的五张牌。
乍一看这看起来很简单,但边框是半透明的并且是渐变的,所以实际的灰度值在很大程度上取决于背景,范围从 ~180 到 240。只要在 Range() 中输入所有这些值就会产生很多噪音。这是边框的特写供引用:
然后我尝试为每条边使用一个模板进行模板匹配,例如对于右边缘,我采用了一堆黑色边框像素和旁边的 4 个灰色像素的渐变,例如
然后我在模板匹配结果上添加阈值,它有点管用:
k = ['right', 'left', 'top', 'bottom']
mode = cv2.TM_CCOEFF_NORMED
matches = {}
addimg = []
for side in k:
template = cv2.imread('./img/ab_' + side + '.png', cv2.IMREAD_GRAYSCALE)
matches[side] = cv2.matchTemplate(im0, template, mode)
v = cv2.inRange(matches[side], 0.987, 1)
#Tools.show(side, v)
addimg.append(v)
im1 = sum(addimg)
但要获得正确的 TM 系数值仍然很困难。此外,当对象较大时,边框渐变比我在模板中使用的灰色像素更宽,因此匹配会变得更糟。
总而言之,我认为我缺少一种可以匹配不同大小和强度的梯度的智能算法。有什么好的想法吗?
PS https://github.com/rc9000/modoscrape/tree/master/img 中还有更多此类屏幕截图
最佳答案
好的,这是我的两分钱。这与梯度检测无关,而是关于如何检测这些卡片的另一种想法。
我认为您关于如何检测事件卡的唯一线索就是这个边界。当然,您可以尝试检测梯度和其他东西,但我的解决方案依赖于
a/边界可以通过简单的“inRange()”与图像的其余部分清楚地分开(作为一个组件)边框而不是渐变]b/边框有一个特定的形状,特别是它周围的边界矩形应该是直的并且有特定的比例。我的意思是,由于您总是在选择一张扑克牌,因此它的高/宽比将始终相同。
所以我的想法是
1/阈值
2/查找组件
3/找到这些组件的边界矩形
4/只选择具有特定比例的边界矩形
代码如下。它有点“快速而肮脏”,有些东西可能会被优化。例如,我没有检查矩形方向,这是一个很好的线索。此外,您可能对卡片的大小有所了解,即使它可能因一张图片而异。此外,您可以消除其他矩形内的矩形,或明显小于其他矩形的矩形...
将此视为探索的“另一种方式”,而不是交 key 解决方案:)
import cv2
import sys
import numpy as np
import csv
#just converting formats of numpy arrays to pass it from one cv2 function to another.
def convert_for_bounding(coords):
nb_pts=len(coords[0])
coordz=np.zeros((nb_pts,2))
for i in range(nb_pts):
coordz[i,:]=np.array([int(coords[0][i]),int(coords[1][i])])
return coordz
#finding width and length of bounding boxes
def find_wid(xs):
maxx=0
for i in range(4):
for j in range(i+1,4):
if abs(xs[i]-xs[j])>=maxx:
maxx=abs(xs[i]-xs[j])
return maxx
img=cv2.imread(your image)
orig=np.copy(img)
img=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
h,w=img.shape
#thresholding with your "180 - 240" range
img = cv2.inRange(img, 180, 240)
#finding all components
nb_edges, output, stats, centroids = cv2.connectedComponentsWithStats(img, connectivity=8)
size_edges = stats[1:, -1]; nb_edges = nb_edges - 1
contours=[]
for i in range(0, nb_edges):
#eliminating small components
if size_edges[i]>=100:
img2=np.zeros((h,w))
img2[output == i + 1] = 255
contours.append(convert_for_bounding(np.nonzero(img2)))
#finding bounding rectangle for each component
for i in range(0,len(contours)):
c=np.array(contours[i]).astype(int)
ar=cv2.minAreaRect(c)
box = cv2.boxPoints(ar)
box = np.int0([box[:,1],box[:,0]]).T
xs=box[:,0]
ys=box[:,1]
wid=find_wid(xs)
hei=find_wid(ys)
#for each rectangle, we'll check if its ratio is like a card one
card_ratio = 285 / 205
if hei!=0:
if hei/wid <=card_ratio*1.05 and hei/wid >= card_ratio*0.95:
cv2.drawContours(orig, [box], -1, (0,0,255), 2)
关于opencv:分割透明边框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43116220/
实际上我只需要用JAVA编写一个简单的程序来将MySQL INSERTS行转换为CSV文件(每个mysql表等于一个CSV文件) 在JAVA中使用正则表达式是最好的解决方案吗? 我的主要问题是如何正确
我有一个 txt 文件,其格式为: Key:value Key:value Key:value ... 我想将所有键及其值放入我创建的 hashMap 中。如何让 FileReader(file) 或
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 要求提供代码的问题必须表现出对所解决问题的最低限度的了解。包括尝试的解决方案、为什么它们不起作用以及预期结果
我每周都会从我的主机下载数据库的备份。它生成一个 .sql 文件,当前大小约为 800mb。此 .sql 文件包含 44 个表。 有什么方法可以通过某些软件将 .sql 文件与所有表分开,以便单独导出
在 iOS 4.0 及更高版本中,有没有一种方法可以在不将整个图像加载到内存的情况下对 CGImage 进行分割?我试图做的是*以编程方式*分割图像,以便在使用大图像的 CATiledLayer 应用
我的 .split() 函数有问题,我有以下字符串: var imageUrl = "Images\Products\randomImage.jpg"; 我想用字符“\”分割,但是,这种情况发生了:
是否可以使用正则表达式将字符串拆分两次?例如,假设我有字符串: example=email@address.com|fname|lname 如何拆分结果为: email@address.com,fna
我正在寻找一种在线程系统(主从)中使用数组的解决方案,它允许我通过用户输入在多个线程上划分矩阵的计算,并将其通过 1 个主线程引导到多个从属线程,这些从属线程计算矩阵的 1 个字段。 我尝试运用我的知
我建立了一个系统来分割包含手写符号的二值图像并对它们进行分类(专门用于音乐)。我知道有商业应用程序可以执行此操作,但这是我尝试将其作为一个项目从头开始。 为了简单起见,假设我的整个图像中有两个元素:
我正在尝试找到一种可接受的复杂性的有效方法 检测图像中的对象,以便将其与周围环境隔离 将该对象分割成它的子部分并标记它们,这样我就可以随意获取它们 我进入图像处理世界已经 3 周了,我已经阅读了很多算
我有一组3D 空间中的点。下图是一个示例: 我想把这些点变成一个面。我只知道点的 X、Y 和 Z 值。例如,查看下图,它显示了从 3D 空间中的点生成的人脸网格。 我在谷歌上搜索了很多,但我找到的是一
我有一个字符串 String placeStr="place1*place2*place3"我想获取包含 place1、place2、place3 的数组,如下所示: String[] places=
我在 Python 中有一个类似于 google.com 的字符串,我想将其分成两部分:google 和 .com。问题是我有一个 URL,例如 subdomain.google.com,我想将其拆分
朋友需要对一个pdf文件进行分割,在网上查了查发现这个pypdf2可以完成这些操作,所以就研究了下这个库,并做一些记录。首先pypdf2是python3版本的,在之前的2版本有一个对应pypdf库。
伙计们,这是一个难以解决的问题,因为它涉及很多硬件细节,所以我想把它放到 EE.SE,但它的主要重点是编程,所以我决定坚持在这里。 我最近怀旧(以及渴望回到 CPU 内在函数),所以我决定自制一个 8
给定 haskell 中的排序列表,我如何获得分段列表,其中连续数字位于同一列表中。例如,如果我有一个排序列表 [1,2,3,4,7,8,10,12,13,15] 结果将是 [[1,2,3 ,4],[
如果我添加三个分割 View ,如下图所示,第三个分割 View (称为 splitView-3)将自动为该分割 View 中的自定义 View 生成约束,例如 customview1 的 Heigh
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 6 年前。 Improve th
如何为馈送给映射器的文件的每一行提供相同文件的拆分? 基本上我想做的是 for each line in file-split { for each line in file{
带有Snappy压缩功能的ORC文件是否可拆分成条形? 据我所知,Snappy Compressed File是不可拆分的。 但我在博客中读到,快速压缩的文件可以在 strip 上拆分。 真的吗? 最
我是一名优秀的程序员,十分优秀!