gpt4 book ai didi

python - 用于 OCR 的 OpenCv pytesseract

转载 作者:太空宇宙 更新时间:2023-11-03 21:17:27 24 4
gpt4 key购买 nike

如何使用opencv和pytesseract从图片中提取文字?

import cv2

导入pytesseract从 PIL 导入图像将 numpy 导入为 np从 matplotlib 导入 pyplot 为 plt

img = Image.open('test.jpg').convert('L')
img.show()
img.save('test','png')
img = cv2.imread('test.png',0)
edges = cv2.Canny(img,100,200)
#contour = cv2.findContours(edges, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
#print pytesseract.image_to_string(Image.open(edges))
print pytesseract.image_to_string(edges)

但是这是错误的-

追溯(最近的调用最后): 文件“open.py”,第 14 行,位于 打印 pytesseract.image_to_string(边缘) 文件“/home/sroy8091/.local/lib/python2.7/site-packages/pytesseract/pytesseract.py”,第 143 行,image_to_string 如果 len(image.split()) == 4:AttributeError: 'NoneType' 对象没有属性 'split'

最佳答案

如果你想使用 opencv 做一些预处理(比如你做了一些边缘检测),然后如果你想提取文本,你可以使用这个命令,

# All the imports and other stuffs goes here
img = cv2.imread('test.png',0)
edges = cv2.Canny(img,100,200)
img_new = Image.fromarray(edges)
text = pytesseract.image_to_string(img_new, lang='eng')
print (text)

关于python - 用于 OCR 的 OpenCv pytesseract,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38159622/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com