gpt4 book ai didi

python - 去除opencv中文字周围的黑线

转载 作者:行者123 更新时间:2023-12-02 17:04:52 25 4
gpt4 key购买 nike

我正在尝试删除文本周围的黑线(如果有的话)。我的目的是只有足够的图像部分来提取其中的每个字符。当我尝试提取字符时,额外的黑线是噪音。
我试过在opencv中使用floodfill,但是在左上角的黑线开始之前,图像包含一些白色像素。所以一直没有结果。我尝试通过寻找轮廓进行裁剪,但即使这样也行不通。
图像如下:
Original Image

import cv2
import numpy as np

img = cv2.imread('./Cropped/22.jpg')
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
_,thresh = cv2.threshold(gray,1,255,cv2.THRESH_BINARY)
contours,hierarchy = cv2.findContours(thresh,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
cnt = contours[0]
x,y,w,h = cv2.boundingRect(cnt)
crop = img[y:y+h,x:x+w]

cv2.imshow('Image',img)
cv2.imshow('Cropped Image',crop)
cv2.waitKey(0)
并使用洪水填充
img = cv2.imread('./Cropped/22.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# threshold the gray image to binarize, and negate it
gray = cv2.bitwise_not(gray)
w = cv2.adaptiveThreshold(gray, 255, cv2.ADAPTIVE_THRESH_MEAN_C, \
cv2.THRESH_BINARY, 15, -2)

# find external contours of all shapes
contours,h = cv2.findContours(bw, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_NONE)

# create a mask for floodfill function, see documentation
h,w,_ = img.shape
mask = np.zeros((h+2,w+2), np.uint8)

# determine which contour belongs to a square or rectangle
for cnt in contours:
poly = cv2.approxPolyDP(cnt, 0.02*cv2.arcLength(cnt,True),True)
if len(poly) == 4:
# if the contour has 4 vertices then floodfill that contour with black color
cnt = np.vstack(cnt).squeeze()
_,binary,_,_ = cv2.floodFill(bw, mask, tuple(cnt[0]), 0)
# convert image back to original color
binary = cv2.bitwise_not(binary)

cv2.imshow('Image', binary)
cv2.waitKey(0)
cv2.destroyAllWindows()
两种情况下的结果如下
Cropped Image
但似乎没有任何变化
Using floodfill
这不会删除任何边框。
这两个代码的想法都是从类似问题的堆栈溢出答案中获得的。
编辑
我接近了@rayryeng 评论中提到的解决方案。但是,当我输入裁剪图像进行数字提取时,我得到这些图像和错误的结果。我猜一些嘈杂的像素没有被删除。
这是原图
Original Image .
阈值图像是 Thresholding Image .提取的轮廓如下 First contour , Second contour , Third contour , Fourth contour .
如果可以对此有一个通用的解决方案,那就太好了。

最佳答案

请注意,黑线所占的区域比文本本身要小得多。此外,我们可以利用文本非常紧密地结合在一起的事实。因此,我可以建议的一件事是将文本 blob 合并在一起,使它们成为一个大 blob。使用顶部有一个 Blob ,底部有一个 Blob 的事实,一旦我们检测到轮廓,我们应该希望我们将拥有三个 Blob ,然后选择具有最大面积的 Blob 并在其周围形成一个边界矩形。

您可以将二进制 blob 与 morphological closing 连接在一起。 ,然后找到轮廓并提取它们的区域。作为附加处理,我们还 dilate轻微的 Blob ,以便我们在裁剪之前可以看到更多文本的背景。
之后,选择面积和裁剪最大的 Blob 。

请注意,我不仅要对您的图像设置阈值,还要执行反向阈值,使黑色区域变为白色,反之亦然。此外,我必须将您的阈值从 1 更改为 128。将无符号 8 位图像的阈值设置为 1 意味着您正在创建一个几乎所有内容都是白色的二进制图像。对于这样的图像,您必须增加容忍度。最后,cv2.findContours OpenCV 2.4.x 和 OpenCV 3.x 之间的调用方式略有不同。总之,该方法还有一个附加输出,即您提供给该方法的源图像,因此您可以放心地忽略它。

import cv2
import numpy as np

img = cv2.imread('MgPg8.jpg') # Image saved offline on my computer
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
_,thresh = cv2.threshold(gray,128,255,cv2.THRESH_BINARY_INV) # Change

# Perform morphological closing
out = cv2.morphologyEx(thresh, cv2.MORPH_CLOSE, 255*np.ones((11, 11), dtype=np.uint8))
# Perform dilation to expand the borders of the text to be sure
out = cv2.dilate(thresh, 255*np.ones((11, 11), dtype=np.uint8))

# For OpenCV 3.0
_,contours,hierarchy = cv2.findContours(out,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE) # Change
# For OpenCV 2.4.x
# contours,hierarchy = cv2.findContours(out,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)

# Find the area made by each contour
areas = [cv2.contourArea(c) for c in contours]

# Figure out which contour has the largest area
idx = np.argmax(areas)

# Choose that contour, then get the bounding rectangle for this contour
cnt = contours[idx]
x,y,w,h = cv2.boundingRect(cnt)

# Crop
crop = img[y:y+h,x:x+w]

cv2.imshow('Image',img)
cv2.imshow('Thresholded Image',thresh)
cv2.imshow('Closed Image',out)
cv2.imshow('Cropped', crop)
cv2.imwrite('thresh.png', thresh)
cv2.imwrite('binary.png', out)
cv2.imwrite('crop.png', crop)
cv2.waitKey(0)
cv2.destroyAllWindows()

我得到以下阈值图像,形态处理图像,最后是裁剪图像:

Thresholded

Binary

Cropped

关于python - 去除opencv中文字周围的黑线,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56479107/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com