python - 聚类边界框并在其上画线(OpenCV、Python)-6ren

python - 聚类边界框并在其上画线(OpenCV、Python)

转载作者：太空宇宙更新时间：2023-11-03 21:18:48

26

4

使用这段代码，我在下图中的字符周围创建了一些边界框:

import csv
import cv2
from pytesseract import pytesseract as pt

pt.run_tesseract('bb.png', 'output', lang=None, boxes=True, config="hocr")

# To read the coordinates
boxes = []
with open('output.box', 'rt') as f:
    reader = csv.reader(f, delimiter=' ')
    for row in reader:
        if len(row) == 6:
            boxes.append(row)

# Draw the bounding box
img = cv2.imread('bb.png')
h, w, _ = img.shape
for b in boxes:
    img = cv2.rectangle(img, (int(b[1]), h-int(b[2])), (int(b[3]), h-int(b[4])), (0, 255, 0), 2)

cv2.imshow('output', img)
cv2.waitKey(0)

输出

我想要的是:

程序应该在边界框的X轴上画一条垂直线(只针对第一个和第三个text-area，中间的那个过程不要感兴趣)。

目标是这样的(还有另一种实现方式，请解释):一旦我有了这两条线(或者，更好的是，一组坐标)，就使用 mask 来覆盖这两个区域。

这可能吗？

源图片:

请求的 CSV:打印(盒子)

[['l', '56', '328', '63', '365', '0'], ['i', '69', '328', '76', '365', '0'], ['n', '81', '328', '104', '354', '0'], ['e', '108', '328', '130', '354', '0'], ['1', '147', '328', '161', '362', '0'], ['m', '102', '193', '151', '227', '0'], ['i', '158', '193', '167', '242', '0'], ['d', '173', '192', '204', '242', '0'], ['d', '209', '192', '240', '242', '0'], ['l', '247', '193', '256', '242', '0'], ['e', '262', '192', '292', '227', '0'], ['t', '310', '192', '331', '235', '0'], ['e', '334', '192', '364', '227', '0'], ['x', '367', '193', '398', '227', '0'], ['t', '399', '192', '420', '235', '0'], ['-', '440', '209', '458', '216', '0'], ['n', '481', '193', '511', '227', '0'], ['o', '516', '192', '548', '227', '0'], ['n', '553', '193', '583', '227', '0'], ['t', '602', '192', '623', '235', '0'], ['o', '626', '192', '658', '227', '0'], ['t', '676', '192', '697', '235', '0'], ['o', '700', '192', '732', '227', '0'], ['u', '737', '192', '767', '227', '0'], ['c', '772', '192', '802', '227', '0'], ['h', '806', '193', '836', '242', '0'], ['l', '597', '49', '604', '86', '0'], ['i', '610', '49', '617', '86', '0'], ['n', '622', '49', '645', '75', '0'], ['e', '649', '49', '671', '75', '0'], ['2', '686', '49', '710', '83', '0']]

编辑:

要使用 zindarod 答案，您需要 tesserocr。通过 pip install tesserocr 安装可能会出现各种错误。我找到了它的 wheel 版本(在尝试安装和解决错误的几个小时后，请参阅我在答案下方的评论...):here you can find/download it .

希望这有帮助..

最佳答案

Google 的 tesseract-ocr 已经在 page segmentation method(psm) 中提供了这个功能.您只需要使用更好的 python 包装器，它比 pytesseract 公开更多的 tesseract 功能。一个更好的是 tesserocr .

一个简单的图片示例:

  import cv2
  import numpy as np
  import tesserocr as tr
  from PIL import Image

  cv_img = cv2.imread('text.png', cv2.IMREAD_UNCHANGED)

  # since tesserocr accepts PIL images, converting opencv image to pil
  pil_img = Image.fromarray(cv2.cvtColor(cv_img,cv2.COLOR_BGR2RGB))

  #initialize api
  api = tr.PyTessBaseAPI()
  try:
    # set pil image for ocr
    api.SetImage(pil_img)
    # Google tesseract-ocr has a page segmentation methos(psm) option for specifying ocr types
    # psm values can be: block of text, single text line, single word, single character etc.
    # api.GetComponentImages method exposes this functionality
    # function returns:
    # image (:class:`PIL.Image`): Image object.
    # bounding box (dict): dict with x, y, w, h keys.
    # block id (int): textline block id (if blockids is ``True``). ``None`` otherwise.
    # paragraph id (int): textline paragraph id within its block (if paraids is True).
    # ``None`` otherwise.
    boxes = api.GetComponentImages(tr.RIL.TEXTLINE,True)
    # get text
    text = api.GetUTF8Text()
    # iterate over returned list, draw rectangles
    for (im,box,_,_) in boxes:
      x,y,w,h = box['x'],box['y'],box['w'],box['h']
      cv2.rectangle(cv_img, (x,y), (x+w,y+h), color=(0,0,255))
  finally:
    api.End()

  cv2.imshow('output', cv_img)
  cv2.waitKey(0)
  cv2.destroyAllWindows()

关于python - 聚类边界框并在其上画线(OpenCV、Python)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47260277/

26

4

0

文章推荐： c# - MVC View 没有将模型传回 Controller ，出现奇怪的错误？

文章推荐： python - 如何使用 Python 在命令提示符中传递命令

文章推荐： c# - 访问 UserControl 资源中的元素

文章推荐： c# - kendo Grid 中的可空枚举属性

Java图形(画线)
我对java Graphics不熟悉，我想在3个按钮上画一条线。我找到了一些绘制线条的方法，但没有一个将其绘制在按钮顶部。这是我的 GUI 类 public class GUI extends JF
qt - Q画家。画线
我正在尝试画线。 int main(int argc, char *argv[]) { QApplication a(argc, argv); MainWindow w; w.
javascript - BabylonJS 画线
我目前正在尝试在 BabylonJS 中跟踪对象的路径。为此，我想在现有位置和以前的位置之间画一条线。我能得到的最接近的是一个立方体。 var plane = BABYLON.Mesh.Creat
java - 基本三角学(画线)
我正在尝试绘制一棵递归树，但我已经卡在了开头。一段时间以来，我一直在尝试解决这个问题，但似乎无法解决。我正在使用 StdDraw 库。这就是我想做的: 我已经画好了树干(黑线)。但我也需要画红线。
python - Pygame:画线
在我之前的问题中 For Loop Functions in Python ,我在放置包含为刽子手游戏划线的命令的函数时遇到了麻烦。它并没有完全划清界线，我首先怀疑这是 for 循环或函数的问题。现在
Android Canvas 画线
我有一个自定义布局，可以根据触摸输入画一条线。我让它画了线，但是当用户触摸屏幕时，线消失了，它画了一条新线。我想要它做的是画一条新线并将上一条线留在那里。这是我的代码: import andr
android - 画线- Android
我想使用触摸监听器在屏幕上画一条线，但是当我再次尝试画线时，它会删除上一条线。我正在使用这段代码:- 我无法找到问题的解决方案。 public class Drawer extends View
drawing - 如何使用 XNA 画线？
我已经阅读了一堆涉及 XNA(以及它的各种版本)的教程，但我仍然对绘制原语感到有些困惑。一切似乎真的很复杂。有人可以使用代码向我展示在屏幕上绘制一两行的最简单的 XNA 实现吗？也许有一个简短的解释
ios - 画线 objective-c
我是 Objective C 的初学者，我试图用 Paint 风格制作一个程序，我正在用平移手势画一条线。我可以做出手势，但问题是我无法在我用鼠标经过的地方画图，每次它重新加载我之前删除的那个点时。帮
javascript - 如何使用 SVG 画线？
如何使用 SVG 绘制连接 2 个图像的线？。例如我想画一条线连接 $1 和 $2(假设 $1 和 $2 是图像): $1 $2 是否需要 Javascript？谢谢! 最佳答案您可以轻松
javascript - 画线 JavaScript - 点击问题
我在创建此代码时遇到问题。我遇到的问题是，当我单击以停止绘制线条时，它有 50% 的机会第一次工作但是如果你只做直线，它似乎只能正常工作，但我希望它从任何方向工作，我不是 100% 确定为什么它不工作
android - TextView onDraw - 画线
我想在我的 TextView 中的数字/字母之间绘制垂直线。所以它看起来应该类似于 A|B|C|D 不使用 | 字符，而是使用 drawLine()。我正在尝试使用 TextView 的宽度来做到这
java - 使用 AWT 画线
我刚刚开始使用 AWT 来使用 GUI。框架正在打开，但线路未显示。 import java.awt.*; import java.awt.event.*; class A extends Frame
ios - 如何使用 UIView 画线？
我可以使用 CGContext 绘制线条。如何使用 UIView 绘制具有相同坐标的线？以后想移动线条，需要用到UIView。 func DrawLine() { UIGraphicsBegi
Javascript 使用 jQuery 画线
请在此处查看我的代码 http://jsbin.com/ijoxa3/edit var drawHorizondalLine = function(x1,y1,x2,y2, color) {
javascript - 用 Canvas 画线
IE9 Canvas 现在支持虚线吗？目前我正在做一些与以下非常相似的事情: var CP = window.CanvasRenderingContext2D && CanvasRenderingCo
c++ - 程序不使用 QPainter 画线
我有一个程序，我正试图在一个小部件上画一条线。这是我的代码: 标题: #include #include class DrawingWidget : public QWidget{ Q_O
javascript - 用 CSS 画线
基于此question ，我写了这个 jsfiddle ，我想补充两点。问题可能是点位于六边形内。这是 HTML:
c# - 从平面边缘 Unity 画线
我正在尝试从一个对象到目标对象画一条线。我设法做到了这一点，但是线条是从中心绘制的我想做的是在目标上绘制从平面边缘到平面边缘的线在此图像中，白线是当前绘制的连接，红线是我希望绘制线的方式现在线条
c# - ILnumerics c#画线
如何添加线条，就像我在 Paint 中使用 ILNumerics 绘制一样？我的场景正在使用该代码构建: ilPanel1.Scene = new ILScene() { new ILP

首页

博学

6Ren·AI

商城

python - 聚类边界框并在其上画线(OpenCV、Python)