python - 检测文本页面上的初始/草图-6ren

python - 检测文本页面上的初始/草图

转载作者：行者123 更新时间：2023-12-04 00:50:14

28

4

我想获取下一页上首字母(“H”)周围框的坐标(以及与其他首字母类似的框，因此 opencv 模板匹配不是一个选项):

正在关注 this教程，我尝试用 opencv contours 解决问题:

import cv2
import matplotlib.pyplot as plt

page = "image.jpg"

# read the image
image = cv2.imread(page)

# convert to RGB
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
# convert to grayscale
gray = cv2.cvtColor(image, cv2.COLOR_RGB2GRAY)

# create a binary thresholded image
_, binary = cv2.threshold(gray, 0,150,cv2.THRESH_BINARY+cv2.THRESH_OTSU)
# find the contours from the thresholded image
contours, hierarchy = cv2.findContours(binary, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
# draw all contours
image = cv2.drawContours(image, contours, 3, (0, 255, 0), 2)
plt.savefig("result.png")

结果当然不是我想要的:

有谁知道可以为我的任务提供简单解决方案的可行算法(可能还有其实现)？

最佳答案

您可以通过过滤轮廓找到目标区域。现在，您至少可以使用两个过滤条件。一种是按区域 过滤 - 也就是说，丢弃太小和太大轮廓，直到获得您正在寻找的轮廓。另一种是通过计算每个轮廓的范围。 extent 是轮廓区域与其边界矩形区域的比率。您正在寻找类似方形的轮廓，因此它的 extent 应该接近 1.0。

让我们看一下代码:

# imports:
import cv2
import numpy as np

# Reading an image in default mode:
inputImage = cv2.imread(path + fileName)
# Deep copy for results:
inputImageCopy = inputImage.copy()

# Convert RGB to grayscale:
grayscaleImage = cv2.cvtColor(inputImage, cv2.COLOR_BGR2GRAY)

# Get binary image via Otsu:
_, binaryImage = cv2.threshold(grayscaleImage, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)

代码的第一部分为您提供了一个二值图像，您可以将其用作计算轮廓的掩码:

现在，让我们过滤轮廓。让我们首先使用 area 方法。您需要定义一个最小面积 和最大面积 的范围，以过滤掉不在此范围内的所有内容。我启发式确定了从 30000 像素到 150000 像素的区域范围:

# Find the contours on the binary image:
contours, hierarchy = cv2.findContours(binaryImage, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

# Look for the outer bounding boxes (no children):
for _, c in enumerate(contours):

    # Get blob area:
    currentArea = cv2.contourArea(c)
    print("Contour Area: "+str(currentArea))

    # Set an area range:
    minArea = 30000
    maxArea = 150000

    if minArea < currentArea < maxArea:

        # Get the contour's bounding rectangle:
        boundRect = cv2.boundingRect(c)

        # Get the dimensions of the bounding rect:
        rectX = boundRect[0]
        rectY = boundRect[1]
        rectWidth = boundRect[2]
        rectHeight = boundRect[3]

        # Set bounding rect:
        color = (0, 0, 255)
        cv2.rectangle( inputImageCopy, (int(rectX), int(rectY)),
                       (int(rectX + rectWidth), int(rectY + rectHeight)), color, 2 )

        cv2.imshow("Rectangles", inputImageCopy)
        cv2.waitKey(0)

成功过滤区域后，您可以使用 cv2.boundingRect 计算轮廓的 bounding rectangle。您可以检索边界矩形的 x、y(左上角)坐标及其 width 和 height。之后，只需在原始输入的深拷贝上绘制矩形。

现在，让我们看看第二个选项，使用轮廓的范围。 for 循环修改如下:

# Look for the outer bounding boxes (no children):
for _, c in enumerate(contours):

    # Get blob area:
    currentArea = cv2.contourArea(c)

    # Get the contour's bounding rectangle:
    boundRect = cv2.boundingRect(c)

    # Get the dimensions of the bounding rect:
    rectX = boundRect[0]
    rectY = boundRect[1]
    rectWidth = boundRect[2]
    rectHeight = boundRect[3]

    # Calculate extent:
    extent = float(currentArea)/(rectWidth *rectHeight)
    print("Extent: " + str(extent))

    # Set the extent filter, look for an extent close to 1.0:
    delta = abs(1.0 - extent)
    epsilon = 0.1

    if delta < epsilon:

        # Set bounding rect:
        color = (0, 0, 255)
        cv2.rectangle( inputImageCopy, (int(rectX), int(rectY)),
                       (int(rectX + rectWidth), int(rectY + rectHeight)), color, 2 )

        cv2.imshow("Rectangles", inputImageCopy)
        cv2.waitKey(0)

两种方法都会产生这样的结果:

关于python - 检测文本页面上的初始/草图，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/67288866/

28

4

0

文章推荐： c - 我的分号怎么了？ (gcc 预处理器)

文章推荐： python - 使用 map() 函数的整数列表输入的绝对值

文章推荐： R:用 Hmisc 标记的矢量时 `median()` 返回的不一致类

python - 检测文本页面上的初始/草图
我想获取下一页上首字母(“H”)周围框的坐标(以及与其他首字母类似的框，因此 opencv 模板匹配不是一个选项): 正在关注 this教程，我尝试用 opencv contours 解决问题: im
javascript - 有没有办法在保持像素大小的同时缩放 p5js 草图？
我正在 p5.js 中开发一个项目，我需要能够定义比我的浏览器窗口大得多的模糊 Canvas 尺寸。我本质上需要保持 p5js 像素大小(例如 3840px、1920px)，但可以看到整个 Canva
arduino - 将二进制数据文件添加到 Arduino 草图
是否可以将二进制数据文件与发送到 Arduino 时传输的 Arduino 草图一起添加？我设法在 IDE 中添加该文件并将其复制到我的项目文件夹中的“数据”目录，但我找不到在我的代码中访问它的方法。
javascript - 如何知道何时加载了 processingjs 草图？
我在处理中编写了自己的草图，并使用 processingjs 和 ajax 将其插入到页面中，如下所示: $.getScript("js/libs/processingjs.js", function
android - 我将如何在 Android 上实时共享聊天/草图？
想象一下，我想做一个用户可以聊天的应用程序，但在视觉上 - 他们会在屏幕上画东西。屏幕会被分成两半，每个参与者都会在自己的一半上画一些东西，其他参与者会看到它。在触摸屏上绘制草图应该非常简单，还可以
javascript - WordPress 页面内的 p5js 草图
我正在尝试将创建的 Canvas 插入到 WordPress 中手动创建的页面模板的 div 元素中: 模板自定义.php 草图.js function setup() { var WI
embedded - 使用 Fritzing 运行 Arduino 草图
我正在尝试学习硬件编程，并为此订购了 Arduino。当我等待它交付时，我开始四处寻找并遇到了 Fritzing 。我能够将 LED 连接到微 Controller 。我的问题是这样的: Fritzi
processing.js - 如何同时运行多个 processing.js 草图
我正在尝试在同一页面上运行多个草图。初始化脚本指定: /* * This code searches for all the * in your page and loads each scrip
svg - 将 SVG 加载到 P5 草图
我已经在 Processing 中编程一段时间了。我还处理过形状和 SVG文件。有关于 SVG 的卑微经验Processing 中的文件让我觉得在 P5.js 中也是一样的故事。，这显然不是这种
uml - 您是否先设计/草图/绘制开发解决方案，然后再进行开发？如果有怎么办？
关闭。这个问题是opinion-based .它目前不接受答案。想改进这个问题？更新问题，以便 editing this post 提供事实和引用来回答它. 3年前关闭。 Improve this
javascript - 如何在同一个 html 页面上显示两个 p5js 草图？
我希望为我的动画工作室建立一个网站，我希望在后台设置一些 p5 草图以增加一些天赋。现在，我设置了两个基本草图，以确保一切正常。一个显示为 pink ，其中一个显示为 blue ，它们被设计为在“我们
javascript - 将表单数据发送到 Canvas 中的外部 pjs 草图
编辑: 我做了更多研究并弄清楚了。将 html 位更改为: Volume: 0%100% (显然我也给了 Canvas 一个 id) 将功能更改为: void changeVolume(slideAm
javascript - 1D perlin 噪声中无法控制的快速 p5.js 草图
对于我的生活，我无法想办法让这个草图以缓慢的速度运行，以清楚地看到移动的波浪图案。只是节奏快得让人抓狂。它使用一维柏林噪声。 let gap = 10; let start = 0; function
javascript - 在 ajax 请求后重新初始化 processing.js 草图
我想重新启动我链接到头部的样式和 processing.js 脚本，以便它们在通过 ajax 请求引入时正确显示。我看到此代码需要在 ajax 请求中的什么位置，但我不知道如何告诉代码简单地重新应用脚
javascript - 在用户单击时使用 ajax 加载 processing.js 草图
我试图在单击时使用 ajax 加载 processing.js 草图，但它不起作用。如果我立即加载草图，它会起作用，但不会在用户交互时起作用。这是我的代码: $('#clicker').click(f
svg - 如何使用没有蒙版或覆盖的 Sketch 插件导出干净的 SVG。草图 49.3
当我将 MSSymbolInstances 导出为 SVG 时，我总是在 SVG 代码中得到这一行。直到我手动编辑上面的填充并将“#1D1F20”更改为“无”，我才能在我的程序中使用SVG。有什么
google-bigquery - 有没有办法在 bigquery 之外合并 bigquery hyperloglog 草图？
我正在尝试弄清楚是否可以从大查询中导出 hyperloglog 草图并在外部合并它们以进行基数估计。是否有可用的开源库可以轻松解析大型查询草图？如果不是，是否有任何关于 biq 查询的 hyperl
p5.js - 如何在 StackOverflow 问题中包含可运行的 p5.js 草图？
如果我对 p5.js 草图有疑问，我如何将我的代码包含在问题中，以便查看问题的人可以快速测试我的代码以查看我正在尝试做什么或有什么问题？我知道我可以使用 {} 工具栏按钮包含代码，该按钮使用 4 个
javascript - 使用 Javascript 创建具有漫画风格/手抖动的 SVG/ Canvas 草图
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 8 年前。 Improve this ques
javascript - 使用 jQuery slider 控制 processing.js 草图
我很幸运地使用 html 表单元素控制了 processing.js 草图，并且想使用 jQuery slider 来做同样的事情。 $(function() { $( "#slider-r

首页

博学

6Ren·AI

商城

python - 检测文本页面上的初始/草图