gpt4 book ai didi

python - 如何使用 Python OpenCV 查找单词并将其裁剪成单个图像?

转载 作者:行者123 更新时间:2023-12-01 21:54:57 24 4
gpt4 key购买 nike

enter image description here

我有一个如图所示的单词二值图像,我想用不同图像中的每个字符裁剪图像。输出应该有 k、7、2、f、5 和 m 的不同图像。我尝试在 python 中使用 OpenCV,但由于某种原因我无法提取它。如果我也可以在每个文本上绘制一个框,那就足够了。

最佳答案

这里有一个简单的方法:

  • 转换为灰度
  • 大津的阈值
  • 查找轮廓,从左到右对轮廓进行排序,并使用轮廓区域进行过滤
  • 提取投资返回率

经过 Otsu 的阈值处理以获得二值图像后,我们使用 imutils.contours.sort_contours() 从左到右对轮廓进行排序.这确保了当我们遍历每个轮廓时,每个字符的顺序都是正确的。此外,我们使用最小阈值区域进行过滤以去除小噪声。这是检测到的字符

enter image description here

我们可以使用 Numpy 切片提取每个字符。这是每个保存的角色的投资返回率

enter image description here

如果你想要另一种方式,只需反转它

ROI = 255 - image[y:y+h, x:x+w]

enter image description here

import cv2
from imutils import contours

image = cv2.imread('1.png')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray,0,255,cv2.THRESH_OTSU + cv2.THRESH_BINARY)[1]

cnts = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]
cnts, _ = contours.sort_contours(cnts, method="left-to-right")

ROI_number = 0
for c in cnts:
area = cv2.contourArea(c)
if area > 10:
x,y,w,h = cv2.boundingRect(c)
ROI = 255 - image[y:y+h, x:x+w]
cv2.imwrite('ROI_{}.png'.format(ROI_number), ROI)
cv2.rectangle(image, (x, y), (x + w, y + h), (36,255,12), 1)
ROI_number += 1
cv2.imshow('thresh', thresh)
cv2.imshow('image', image)
cv2.waitKey()

关于python - 如何使用 Python OpenCV 查找单词并将其裁剪成单个图像?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58382937/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com