- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在尝试实现研究论文 "Automatic License Plate Recognition Using Deep Learning Technique" 中所写的基于边缘的二值化算法但是我在实现它时得到的最终图像全黑并且找不到问题。
import cv2
import numpy as np
def edge_based_binarization(image):
edge_image = cv2.Canny(image, 0, 255)
binary_image = np.zeros(shape=image.shape)
Hblocks = 10
Vblocks = 5
blockH = np.floor(image.shape[0] * 1.0 / Vblocks)
blockH = np.array(blockH, dtype=np.uint8)
blockW = np.floor(image.shape[1] * 1.0 / Hblocks)
blockW = np.array(blockW, dtype=np.uint8)
for r in range(Vblocks):
for c in range(Hblocks):
r0 = r * blockH + 1
c0 = c * blockW + 1
imgblock = image[r0 : r0 + blockH, c0 : c0 + blockW]
edgeblock = edge_image[r0 : r0 + blockH, c0 : c0 + blockW]
t = find_threshold(imgblock, edgeblock)
if(np.all(imgblock < t)):
binary_image[r0 : r0 + blockH, c0 : c0 + blockW] = 1
else:
binary_image[r0 : r0 + blockH, c0 : c0 + blockW] = 0
binary_image = np.array(binary_image, dtype=np.uint8)
return binary_image
def find_threshold(imgblock,edgeblock):
t1 = [ ]
for r in range(3,imgblock.shape[0] - 2):
for c in range(3,imgblock.shape[1] - 2):
if(edgeblock[r,c] == 255 and edgeblock[r,c-1] == 0 and edgeblock[r,c+1] == 0):
m = min(imgblock[r,c-2], imgblock[r,c+2])
if m < 128:
t2 = np.mean(imgblock[r,c-2 : c+2]) * 1.0
t1.append(t2)
if(edgeblock[r,c] == 255 and edgeblock[r-1,c] == 0 and edgeblock[r+1,c] == 0):
m = min(imgblock[r-2,c], imgblock[r+2,c])
if m < 128:
t2 = np.mean(imgblock[r-2 : r+2,c]) * 1.0
t1.append(t2)
if len(t1) == 0:
t = 0
else:
t = np.mean(t1) - np.std(t1)
return t
img = cv2.imread("test1.jpg")
cv2.imshow("Orig", img)
img = edge_based_binarization(img)
cv2.imshow("Edge", img)
cv2.waitKey(0)
论文中给出的代码 find threshold function edge based binarization function
最佳答案
将给定的代码与论文中的内容进行比较后,我必须说论文中附加的实现是错误的。
我没有搜索其他证明,但根据论文中的说法,该算法通过估计 10x5 像素区域内边缘像素的局部阈值并随后从这些相当小的像素组装整个二值图像来对图像进行二值化补丁。
给定的实现将图像分成 10 个垂直 block 和 5 个水平 block ,从而产生更大的区域。
Hblocks = 10
Vblocks = 5
blockH = np.floor(image.shape[0] * 1.0 / Vblocks)
blockH = np.array(blockH, dtype=np.uint8)
blockW = np.floor(image.shape[1] * 1.0 / Hblocks)
blockW = np.array(blockW, dtype=np.uint8)
由于该算法总体上是正确的,因此在估计阈值时,实际上只需要对 block 大小进行小的修正,并对范围大小进行小的调整。
#!/usr/bin/env python
import cv2
import numpy as np
from sys import argv
from math import floor
def edge_based_binarization(image):
edge_image = cv2.Canny(image, 0, 255)
cv2.imwrite("edge.png", edge_image)
binary_image = np.zeros(shape=image.shape)
# Fix block sizes
blockWidth = 10
blockHeight = 5
verticalBlocks = floor(image.shape[0] / blockHeight)
horizontalBlocks = floor(image.shape[1] / blockWidth)
for r in range(verticalBlocks):
for c in range(horizontalBlocks):
# Fix 1 pixel border
r0 = r * blockHeight
c0 = c * blockWidth
imgblock = image[r0: r0 + blockHeight, c0: c0 + blockWidth]
edgeblock = edge_image[r0: r0 + blockHeight, c0: c0 + blockWidth]
t = find_threshold(imgblock, edgeblock)
if(np.all(imgblock > t)):
binary_image[r0: r0 + blockHeight, c0: c0 + blockWidth] = 0
else:
binary_image[r0: r0 + blockHeight, c0: c0 + blockWidth] = 1
return binary_image * 255.0
def find_threshold(imgblock, edgeblock):
t1 = []
# Adjust range indices
# Otherwise it would result in an empty range for the 5px height
for r in range(2, imgblock.shape[0] - 2):
for c in range(2, imgblock.shape[1] - 2):
if(edgeblock[r, c] == 255 and edgeblock[r, c - 1] == 0 and edgeblock[r, c + 1] == 0):
m = min(imgblock[r, c - 2], imgblock[r, c + 2])
if m < 128:
t2 = np.mean(imgblock[r, c - 2: c + 2])
t1.append(t2)
if(edgeblock[r, c] == 255 and edgeblock[r - 1, c] == 0 and edgeblock[r + 1, c] == 0):
m = min(imgblock[r - 2, c], imgblock[r + 2, c])
if m < 128:
t2 = np.mean(imgblock[r - 2: r + 2, c])
t1.append(t2)
if len(t1) == 0:
t = 0
else:
t = np.mean(t1) - np.std(t1)
return t
img = cv2.imread(argv[1])
cv2.imshow("Orig", img)
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
bin_img = edge_based_binarization(img)
cv2.imshow("Edge", bin_img)
cv2.waitKey(0)
关于python - 基于边缘的二值化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48020440/
我有一串数字。我需要检查边缘上的数字是否对称,这意味着它们以 2 为模时具有相同的余数。 我已经编写了一个有效的代码,但我对此感到不安,在一些失败之后我想出了这个代码: int PaliPair(ch
我要删除黑色蒙版和人体图像之间的白色边框 图像输入示例: 厚度为1的图像输出: 厚度为2的图像输出: 我尝试了一些在这里找到的具有模糊和阈值的游戏 我还使用此代码查找和绘制轮廓 thickne
这应该是一个在用户悬停时打开的飞出菜单。 这在 Chrome 中工作得很好,我已经尝试了多种方法(使用 CSS :hover,(mousenter)和(mouseleave ) 问题是 - 使用 Ed
我有一个 Apache 服务器 v2.4.43 为我的网站提供服务,我使用一个简单的 .htpasswd,我使用指令“AuthUserFile ”在 .htaccess 中调用它来进行身份验证。 现在
如何仅使用剪辑路径创建波浪边缘? 波浪应该是这样的图像: 最佳答案 您应该通过波函数及其频率生成此剪辑路径。 我用过 cos()在 PHP 中。您可以找到如下链接: https://repl.it/@
我有这张图: digraph G { 1 [label="car"]; 2 [label="x"]; 3 [label="car"]; 4 [label="y"]; 5 [label="cdr"];
我想强制点仅显示节点之间的垂直或水平边缘。 我在帖子 Family tree layout with Dot/GraphViz 中发现了类似的请求,但我不处理树,所以我希望有一个解决方案,无需插入额外
我已经设法让两个直方图重叠,但如果你仔细观察,条形开始倾斜并且没有完全重叠。 我已经调整了线宽和宽度,并没有改善。 我的目标是让所有的条形排列在彼此的顶部,黑边没有歪斜。 有什么办法解决这个问题 这是
我已经设法让两个直方图重叠,但如果你仔细观察,条形开始倾斜并且没有完全重叠。 我已经调整了线宽和宽度,并没有改善。 我的目标是让所有的条形排列在彼此的顶部,黑边没有歪斜。 有什么办法解决这个问题 这是
我一直在与 latex table 搏斗太久了。我需要一个具有居中标题的表格,以及包含可能环绕的文本的正文单元格。由于环绕要求,我使用 p{xxx} 而不是 l 来指定单元格宽度。这导致的问题是单元格
有没有办法平滑转换(平移和旋转)的 BufferedImage 的锯齿状边缘? 测试图像的放大 View : (请注意,这不是将要使用的实际 BufferedImage,仅用于此处演示)。 已使用双线
我在 my page 有一个旋转木马.我的父元素和子元素的边缘都是 flex 的,但是当您按“下一个”或“上一个”并滑动旋转木马时,子元素在移动时不会保持 flex 。我怎样才能避免这种情况? .ho
我在 .boxwrap 和 .lsmlbox + .rsmlbox 之间的嵌套 div 中添加了不必要的空格,这使得无法将 .smlbox + .rsmlbox 与 .box 对齐我相信这是一个比预期
我正在使用 Apple 的 ARKit 制作 AR 应用程序,我想制作盒子的线框轮廓。代码中描述并显示在图片中的那个在盒子的每个面上绘制斜边。它还隐藏了盒子另一侧的角。 Scene Kit 中有没有办
下图仅包含阈值处理后的黑色和白色像素。我在此图像的顶部绘制了一个灰色的旋转矩形。现在我想计算这个旋转矩形内的黑色像素数,但不包括白色矩形矩形外的黑色像素(即白色矩形内的像素数)。 做到这一点的最佳方法
你们如何处理边际 CSS?我所说的边缘是指需要斜体或粗体的单个单词或短语。只用 声明一个“大胆”的类似乎很愚蠢 Bold { font-weight: bold; } 或者斜体,要么! Italic
好的。我知道有几十个类似的线程。我几乎检查了每一个,但找不到可行的解决方案。我试过负边距、最小高度、最大高度、绝对页脚、正文背景颜色,甚至将溢出:隐藏到页面中的所有主要容器。然后将 clearfix
我网站的一部分使用代码使用倾斜边缘: -webkit-clip-path: 多边形(0% 0%, 100% 0%, 81% 100%, 0% 100%) 这在 Chrome 中运行良好,但不适用于任何
我一直在创建这个网站,并且进展顺利。然后我试着给它添加一个模态,但一切都有点走下坡路。问题是在添加模式后,Chrome 中的图像对齐方式发生了变化。它在 Edge 中运行良好。现在我知道这可能是因为
如果我在 Matlab 中使用 image() 命令制作一个 4 x 4 像素的图像,它会将刻度线居中放置在像素的中间。我希望刻度线以像素的左下角为中心。有什么方法可以做到这一点吗? 最佳答案 您可以
我是一名优秀的程序员,十分优秀!