作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在对电视镜头中的文本应用 OCR。 (我正在使用 Tesseact 3.x
w/C++
)我正在尝试拆分文本和背景部分作为 OCR 的预处理。
对于通常的镜头,文本和背景具有高对比度(例如白色与黑色),因此修改 Gamma 就可以完成这项工作。但是,这张附加图像(黄色文本,背景为橙色/红色天空)让我很难进行预处理。
从背景中分离黄色文本的好方法是什么?
最佳答案
下面是使用 Python 2.7
、OpenCV 3.2.0
和 Tesseract 4.0.0a
的简单解决方案。将 Python
转换为 C++
for OpenCV
应该不难,然后调用 tesseract API
执行 OCR。
import numpy as np
import cv2
import matplotlib.pyplot as plt
%matplotlib inline
def show(title, img, color=True):
if color:
plt.imshow(img[:,:,::-1]), plt.title(title), plt.show()
else:
plt.imshow(img, cmap='gray'), plt.title(title), plt.show()
def ocr(img):
# I used a version of OpenCV with Tesseract binding. Modes set to:
# Page Segmentation mode (PSmode) = 11 (defualt = 3)
# OCR Enginer Mode (OEM) = 3 (defualt = 3)
tesser = cv2.text.OCRTesseract_create('C:/Program Files/Tesseract 4.0.0/tessdata/','eng', \
'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz',3,3)
retval = tesser.run(img, 0) # return text string type
print 'OCR Output: ' + retval
img = cv2.imread('./imagesStackoverflow/yellow_text.png')
show('original', img)
# apply GaussianBlur to smooth image, then threshholds yellow to white (255,255, 255)
# and sets the rest to black(0,0,0)
img = cv2.GaussianBlur(img,(5,5), 1) # smooth image
mask = cv2.inRange(img,(40,180,200),(70,220,240)) # filter out yellow color range, low and high range
show('mask', mask, False)
# invert the image to have text black-in-white
res = 255 - mask
show('result', res, False)
# pass to tesseract to perform OCR
ocr(res)
处理后的图像和 OCR 输出(参见图像的最后一行):
希望这对您有所帮助。
关于c++ - 拆分文本和背景作为 OCR (Tesseract) 的预处理,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43621225/
在 python 中,为什么 os.path.splitext 使用 '.'作为扩展分隔符而不是 os.extsep? 最佳答案 os.extsep 是通过导入 os.path.extsep 定义的。
我是一名优秀的程序员,十分优秀!