python-3.x - 模板匹配 : efficient way to create mask for minMaxLoc?

转载作者：太空宇宙更新时间：2023-11-03 21:32:03

OpenCV 中的模板匹配很棒。您可以将掩码传递给 cv2.minMaxLoc，这样您就可以只在部分图像中搜索(某种程度上)所需的模板。您也可以在 matchTemplate 操作中使用掩码，但这只会掩码模板。

我想找到一个模板，并且我想确保这个模板在我的图像的某个其他区域内。

计算 minMaxLoc 的掩码似乎有点繁重。也就是说，计算一个准确掩码感觉很重。如果您以简单的方式计算掩码，它会忽略模板的大小。

例子是有序的。我的输入图像如下所示。他们有点做作。我想找到糖果棒，但前提是它完全在钟面的白色圆圈内。

时钟1

时钟2

模板

在时钟 1 中，糖果棒位于圆形钟面内，是“PASS”。但是在 clock2 中，糖果棒只是部分在脸上，我希望它是一个“失败”。这是一个简单的代码示例。我使用 cv.HoughCircles 来查找钟面。

import numpy as np
import cv2

img = cv2.imread('clock1.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

template = cv2.imread('template.png')
t_h, t_w = template.shape[0:2]  # template height and width

# find circle in gray image using Hough transform
circles = cv2.HoughCircles(gray, method = cv2.HOUGH_GRADIENT, dp = 1, 
                           minDist  = 150, param1 = 50, param2 = 70,
                           minRadius = 131, maxRadius = 200)
i = circles[0,0]
x0 = i[0]
y0 = i[1]
r  = i[2] 

# display circle on color image
cv2.circle(img,(x0, y0), r,(0,255,0),2)

# do the template match
result = cv2.matchTemplate(img, template, cv2.TM_CCOEFF_NORMED)

# finally, here is the part that gets tricky. we want to find highest
# rated match inside circle and we'd like to use minMaxLoc

# make mask by drawing circle on zero array
mask = np.zeros(result.shape, dtype = np.uint8)  # minMaxLoc will throw
                                                 # error w/o np.uint8
cv2.circle(mask, (x0, y0), r, color = 1, thickness = -1)

# call minMaxLoc
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(result, mask = mask)

# draw found rectangle on img
if max_val > 0.4:  # use 0.4 as threshold for finding candy bar
    cv2.rectangle(img, max_loc, (max_loc[0]+t_w, max_loc[1]+t_h), (0,255,0), 4)

cv2.imwrite('output.jpg', img)

使用clock1输出

使用clock2输出甚至找到糖果棒虽然有一部分在圈外

因此，为了正确制作 mask ，我使用了一堆 NumPy 操作。我制作了四个单独的蒙版(一个用于模板边界框的每个角)，然后将它们组合在一起。我不知道 OpenCV 中有任何便利功能可以为我做掩码。我有点担心所有的数组操作都会很昂贵。有更好的方法吗？

h, w = result.shape[0:2]

# make arrays that hold x,y coords 
grid = np.indices((h, w))
x = grid[1]
y = grid[0]

top_left_mask  = np.hypot(x - x0, y - y0) - r < 0
top_right_mask = np.hypot(x + t_w - x0, y - y0) - r < 0
bot_left_mask  = np.hypot(x - x0, y + t_h - y0) - r < 0
bot_right_mask = np.hypot(x + t_w - x0, y + t_h - y0) - r < 0

mask = np.logical_and.reduce((top_left_mask, top_right_mask, 
                              bot_left_mask, bot_right_mask))
mask = mask.astype(np.uint8)
cv2.imwrite('mask.png', mask*255)

这是“奇特”面具的样子:

似乎是对的。由于模板形状，它不能是圆形的。如果我用这个掩码运行 clock2.jpg 我得到:

它有效。没有识别出糖果棒。但我希望我能用更少的代码行来做到这一点......

编辑:我做了一些分析。我以“简单”方式和“准确”方式运行了 100 个循环并计算了每秒帧数 (fps):

简单方法:12.7 fps
准确方式:7.8 fps

因此使用 NumPy 制作面具需要付出一些代价。这些测试是在功能相对强大的工作站上完成的。它可能会在更普通的硬件上变得更丑陋......

最佳答案

方法一:在cv2.matchTemplate之前'mask'图像

只是为了好玩，我尝试为我传递给 cv2.matchTemplate 的图像制作自己的面具。看看我能达到什么样的表现。需要明确的是，这不是一个合适的蒙版——我将所有要忽略的像素设置为一种颜色(黑色或白色)。这是为了解决只有 TM_SQDIFF 和 TM_CORR_NORMED 支持正确掩码的事实。

@Alexander Reynolds 在评论中提出了一个非常好的观点，如果模板图像(我们试图找到的东西)有很多黑色或白色，则必须小心。对于许多问题，我们将先验知道模板是什么样的，我们可以指定白色背景或黑色背景。

我使用 cv2.multiply ，这似乎比 numpy.multiply 快. cv2.multiply 具有额外的优势，它会自动将结果限制在 0 到 255 的范围内。

import numpy as np
import cv2
import time

img = cv2.imread('clock1.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

template = cv2.imread('target.jpg')
t_h, t_w = template.shape[0:2]  # template height and width

mask_background = 'WHITE'

start_time = time.time()

for i in range(100):  # do 100 cycles for timing
    # find circle in gray image using Hough transform
    circles = cv2.HoughCircles(gray, method = cv2.HOUGH_GRADIENT, dp = 1, 
                               minDist  = 150, param1 = 50, param2 = 70,
                               minRadius = 131, maxRadius = 200)
    i = circles[0,0]
    x0 = i[0]
    y0 = i[1]
    r  = i[2] 

    # display circle on color image
    cv2.circle(img,(x0, y0), r,(0,255,0),2)

    if mask_background == 'BLACK':  # black = 0, white = 255 on grayscale
        mask = np.zeros(img.shape, dtype = np.uint8)

    elif mask_background == 'WHITE':
        mask = 255*np.ones(img.shape, dtype = np.uint8)

    cv2.circle(mask, (x0, y0), r, color = (1,1,1), thickness = -1)
    img2 = cv2.multiply(img, mask)  # element wise multiplication
                                    # values > 255 are truncated at 255
    # do the template match
    result = cv2.matchTemplate(img2, template, cv2.TM_CCOEFF_NORMED)

    # call minMaxLoc
    min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(result)

    # draw found rectangle on img
    if max_val > 0.4:
        cv2.rectangle(img, max_loc, (max_loc[0]+t_w, max_loc[1]+t_h), (0,255,0), 4)

fps = 100/(time.time()-start_time)
print('fps ', fps)

cv2.imwrite('output.jpg', img)

分析结果:

黑色背景 12.3 fps
白色背景 12.1 fps

相对于原始问题中的 12.7 fps，使用此方法对性能的影响很小。但是，它的缺点是它仍然会找到仍然稍微超出边缘的模板。根据问题的确切性质，这在许多应用中可能是可以接受的。

方法二:使用cv2.boxFilter为 minMaxLoc 创建掩码

在此技术中，我们从圆形掩码开始(如在 OP 中)，然后使用 cv2.boxFilter 对其进行修改。我们将 anchor 从内核的默认中心更改为左上角 (0, 0)

import numpy as np
import cv2
import time

img = cv2.imread('clock1.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

template = cv2.imread('target.jpg')
t_h, t_w = template.shape[0:2]  # template height and width
print('t_h, t_w ', t_h, ' ', t_w)

start_time = time.time()

for i in range(100):
    # find circle in gray image using Hough transform
    circles = cv2.HoughCircles(gray, method = cv2.HOUGH_GRADIENT, dp = 1, 
                               minDist  = 150, param1 = 50, param2 = 70,
                               minRadius = 131, maxRadius = 200)
    i = circles[0,0]
    x0 = i[0]
    y0 = i[1]
    r  = i[2] 

    # display circle on color image
    cv2.circle(img,(x0, y0), r,(0,255,0),2)

    # do the template match
    result = cv2.matchTemplate(img, template, cv2.TM_CCOEFF_NORMED)

    # finally, here is the part that gets tricky. we want to find highest
    # rated match inside circle and we'd like to use minMaxLoc

    # start to make mask by drawing circle on zero array
    mask = np.zeros(result.shape, dtype = np.float)  
    cv2.circle(mask, (x0, y0), r, color = 1, thickness = -1)

    mask = cv2.boxFilter(mask, 
                         ddepth = -1, 
                         ksize = (t_w, t_h), 
                         anchor = (0,0),
                         normalize = True,
                         borderType = cv2.BORDER_ISOLATED)
    # mask now contains values from zero to 1. we want to make anything
    # less than 1 equal to zero
    _, mask = cv2.threshold(mask, thresh = 0.9999, 
                        maxval = 1.0, type = cv2.THRESH_BINARY)
    mask = mask.astype(np.uint8)

    # call minMaxLoc
    min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(result, mask = mask)

    # draw found rectangle on img
    if max_val > 0.4:
        cv2.rectangle(img, max_loc, (max_loc[0]+t_w, max_loc[1]+t_h), (0,255,0), 4)

fps = 100/(time.time()-start_time)
print('fps ', fps)

cv2.imwrite('output.jpg', img)

此代码提供与 OP 相同的掩码，但帧率为 11.89 fps。与方法 1 相比，此技术为我们提供了更高的准确性，同时对性能的影响也略有增加。

关于python-3.x - 模板匹配 : efficient way to create mask for minMaxLoc?，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50614950/

文章推荐： html - 输入和提交按钮在同一行

文章推荐： c# - Unity 的 Google Play 服务插件有一些错误

python - 比较两个 mask 以确定哪个 mask 比另一个 mask 更矩形->测量矩形
我有两个包含两个接近矩形的形状的蒙版。面罩示例(黄色): 现在，我要确定其中一个遮罩比另一个遮罩更接近实际矩形。有可能实现吗？最佳答案获取轮廓和(旋转的)矩形边界框之间的面积差。面积差异最小的
python - numpy 1.13 MaskedArrayFutureWarning : setting an item on a masked array which has a shared mask will not copy the mask
我最近从 numpy 1.11 升级到 numpy 1.13 希望摆脱这个屏蔽数组警告，但它仍然存在: MaskedArrayFutureWarning:在具有共享掩码的掩码数组上设置项目不会复制掩码
javascript - 如何在商店加载之前向面板添加 mask 并在商店加载后删除 mask
我需要在sencha中的选项卡面板中添加一个加载掩码，我在 Controller 中通过Ajax请求加载了一个商店，但是在商店加载之前我需要放置一个加载掩码，并且在商店加载之后已加载，我需要将其删除。
c - 优化 "i = b ? (i | mask) : (i & ~mask)"
我希望能够设置或清除 uintX_t 的(多个)位。 i 是一个运行时变量 (uintX_t)。b 是一个运行时变量 (uintX_t)，它被限制为 0 或 1。 mask 是编译时常量。有没有比以
internet-explorer - IE和FF中的Extjs mask 和取消 mask
我有一个处理程序，更像是一个提交按钮。我想掩盖整个页面或该表单以显示等待消息，直到完成其余过程。我做到了，它在FF中有效，但在IE中没有成功，当我执行Ext.getCmp('').body.mask(
mask - SnapSVG : Remove mask from an element (unmask)
我有我使用 Snap SVG 的 JS 代码。在某些时候我使用 element.attr({mask:maskelement}); 在该片段中，element和 maskelement是我的 svg
java - 从图标中获取 "XOR Mask"和 "AND mask"
我需要从图标(.ICO) 文件中获取XOR Mask 和AND Mask。如果有人可以建议我如何从 Java 执行此操作，那就太棒了。如果没有，您是否知道有任何应用程序可以获取这两个掩码并允许您扔掉
swift - 如何正确使用Scenekit的类别 mask 、碰撞 mask 和物理体、contactTestBitMask并做出适当的碰撞？
我一直在尝试学习scenekit并完成了一本书，但只有碰撞检测部分不明白，也许是最重要的部分。有类别掩码、共谋掩码和物理体？.contactTestBitMask。我想创建一个简单的游戏来实现这个目
javascript - 使用外部 mask 透明 fabricjs mask 物体
我在 Canvas 上制作了一个矩形 mask ，我需要 mask 外的任何东西都具有 0.8 的不透明度，因此 mask 外的所有对象都被视为不透明请看一下 fiddle 。 http://jsfi
css - 用覆盖 mask div，防止 mask 滚动
我有一个包含可滚动内容的 div。我想为其添加一个覆盖内容的颜色 mask ，但不会随内容滚动。 http://jsfiddle.net/6e9t1wt3/1/ *{box-sizing:bord
c++ - (mask >> i & 1) 和 (mask & 1 << i) 哪个更快？
在我的代码中，我必须选择这两个表达式之一(其中 mask 和 i 是非常数整数 -1 > i & 1) 和 (mask & 1 << i) 哪个更快？，我们在Stack Overflow上找到一个类似
ios - Imageview ios 中的 mask 和反向 mask
我有一个包含 Image 的 Imageview 。还有一个包含兔子形状的面具形状。我有一个代码可以给出以下结果。 - (UIImage*)mynewmaskImage:(UIImage *)imag
c++ - if (mask & VALUE) 还是 if ((mask & VALUE) == VALUE)？
您可能熟悉 enum 位掩码方案，例如: enum Flags { FLAG1 = 0x1, FLAG2 = 0x2, FLAG3 = 0x4, FLAG4 = 0x8
How to get the mask average for multi-token masking?(如何获得多令牌掩码的掩码平均值？)
在本文之后，我将尝试实现他们如何计算每个实体的对数概率的平均值(第3.3节)。更具体地说，每个实体的得分计算为其令牌上的日志概率的平均值。。我有一个实体列表和一些提示：。任务是为每个提示找到应该适合的
opengl - 包含 Alpha 的 mask 图像使内部 mask 变黑
我正在尝试遮盖比 mask 小的背景图像。背景和蒙版之间的空间显示为黑色。这是我正在使用的代码: batch.end(); batch.begin(); Gdx
CSS:使用 Mask 作为 Webkit-Mask-Image 的后备
因此，我一直在尝试将背景图像裁剪成圆形六边形，我发现 webkit 令人惊叹的 mask 图像非常容易地解决了我所有的问题。遗憾的是，它仅适用于 Chrome 和 Safari(当然)。我如何为非
java - 将 Maven mask jar 包含到其他 mask jar 中
我有两个Java项目数据服务应用程序和数据报告应用程序，数据服务应用程序生成用于某些处理和数据报告应用程序的某些数据应该使用数据服务应用程序来使用它生成的数据来生成一些报告，这两个应用程序都应该构建为
android - 将 mask 应用于单个叠加 View 而不 mask 整个 Activity
我有一个带有绿色背景的简单 Activity ，我正在尝试提供一个带有透明圆形区域的红色叠加层。这是我要实现的效果: Expected Image 根据我在网上找到的代码，我看到的是这样的: Resu
python - 值错误 : Num gradients 1 generated for op name: "mask/Mask"
我关注了这个link创建一个名为 mask 的自定义操作。tensorflow op的主体是 def tf_mask(x, labels, epoch_, name=None): # add "la
ios - 向具有 mask View 的 View 添加 subview 会从中移除 mask
正如标题所说，我有 self.view，我将其添加到它的 mask 中(link) 属性另一个 View ，但是当我使用 addSubview 添加更多 View 到 self.view 时，掩码被删

太空宇宙

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python-3.x - 模板匹配 : efficient way to create mask for minMaxLoc?

方法一:在cv2.matchTemplate之前'mask'图像

方法二:使用cv2.boxFilter为 minMaxLoc 创建掩码