gpt4 book ai didi

python - 如何使用 OpenCV 和 pytesseract image_to_string() 从图像中提取数字?

转载 作者:太空宇宙 更新时间:2023-11-03 22:36:56 26 4
gpt4 key购买 nike

我正在尝试使用 OpenCV 和 pytesseract 的 image_to_string() 方法从图像中提取数字,但输出效果不佳。

image

我尝试了一些预处理方法,如调整大小和噪声过滤器,但仍然无法获得准确的结果。我该如何处理?

最佳答案

这是一个简单的预处理步骤,用于在使用 pytesseract 之前清理图像

  • 将图像转换为灰度
  • 锐化图像
  • 执行形态转换以增强文本

由于您的输入图像看起来很模糊,我们可以使用 cv2.filter2D() 和通用锐化内核来锐化图像。可以找到其他类型的内核 here

image = cv2.imread('1.png')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
sharpen_kernel = np.array([[-1,-1,-1], [-1,9,-1], [-1,-1,-1]])
sharpen = cv2.filter2D(gray, -1, sharpen_kernel)

文字有小孔,我们可以使用cv2.dilate()来闭合小孔,平滑图像

sharpen = 255 - sharpen
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (2,2))
dilate = cv2.dilate(sharpen, kernel, iterations=1)
result = 255 - dilate

这是结果。您可以尝试仅使用锐化图像或使用 pytesseract 增强图像

import cv2
import numpy as np

image = cv2.imread('1.png')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
sharpen_kernel = np.array([[-1,-1,-1], [-1,9,-1], [-1,-1,-1]])
sharpen = cv2.filter2D(gray, -1, sharpen_kernel)

cv2.imwrite('sharpen.png', sharpen)
sharpen = 255 - sharpen
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (2,2))
dilate = cv2.dilate(sharpen, kernel, iterations=1)

result = 255 - dilate
cv2.imwrite('result.png', result)
cv2.waitKey(0)

关于python - 如何使用 OpenCV 和 pytesseract image_to_string() 从图像中提取数字?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57530136/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com