python - 增强OCR的图像-6ren

python - 增强OCR的图像

转载作者：行者123 更新时间：2023-12-02 16:54:36

25

4

[这是示例图像]

我想为OCR这样一些其他类似的彩色图像裁剪标题Text。什么是最有效的步骤来预处理图像，以便仅对标题文本进行更好的识别。

最佳答案

注意

对于所有想要复制代码并想在其他项目中使用的人:您将不得不对其进行调整和调整(尤其是阈值/内核/迭代值)。
此版本最好在用户提供的图像上运行。

import cv2

image = cv2.imread("image.jpg")
image_c = image.copy()

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)  # grayscale
cv2.imshow('gray', gray)
cv2.waitKey(0)

_, thresh = cv2.threshold(gray, 50, 255, cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)  # threshold
cv2.imshow('thresh', thresh)
cv2.waitKey(0)

kernel = cv2.getStructuringElement(cv2.MORPH_CROSS, (3, 3))

dilated = cv2.dilate(thresh, kernel, iterations=13)  # dilate
cv2.imshow('dilated', dilated)
cv2.waitKey(0)

image, contours, hierarchy = cv2.findContours(dilated, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_NONE)  # get contours

# for each contour found, draw a rectangle around it on original image
for i, contour in enumerate(contours):
    # get rectangle bounding contour
    x, y, w, h = cv2.boundingRect(contour)

    roi = image_c[y:y + h, x:x + w]

    if 50 < h < 100 or 200 < w < 420:  # these values are specific for this example

        # draw rectangle around contour on original image
        rect = cv2.rectangle(image_c, (x, y), (x + w, y + h), (255, 255, 255), 1)
        cv2.imshow('rectangles', rect)
        cv2.waitKey(0)

        cv2.imwrite('extracted{}.png'.format(i), roi)


# write original image with added contours to disk - change values above to (255,0,255) to see clearly the contours
cv2.imwrite("contoured.jpg", image_c)

关于python - 增强OCR的图像，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49316237/

25

4

0

文章推荐： opencv - hololens 中的对象跟踪

文章推荐： opencv - 看起来 opencv 交换了蓝色和红色 channel ？

文章推荐： python - 如何使用 python 将原始 Y 视频缓冲区转换为图像？

文章推荐： opencv - 基于条件的IO操作的常量变量初始化

java - 增强 for 循环的最后一次迭代
我正在尝试使用增强的 for 循环遍历 Iterable，但我无法确定何时处理最后一个值。 public void apply(Tuple key,
excel - 增强 excel 多个查找和替换脚本
我正在使用以下代码在 Sheet2 的 A:H 范围内查找和替换 Sheet1 中存在的单词列表(ColA 用于 FIND 单词，ColB 用于 REPLACE 单词)。它执行这项工作，但非常缓慢。可
java - 增强 Hibernate 数据库架构？
我正在使用 Hibernate (JPA2) hibernate.hbm2ddl.auto=update用于测试和 hibernate.hbm2ddl.auto=validate用于生产。我想要做的
scala - 增强 Scala 中的预定义方法
基本问题: 为什么我只能用 Scala 编写: println(10) 为什么我不需要写: Console println(10) 后续问题: 如何引入一个新方法“foo”，它像“println”一样
使用 Bazel 增强 Datanucleus
我正在尝试将 Maven 项目迁移到 Bazel，但在 Datanucleus 增强方面遇到了麻烦。后 jar -file 已构建，Datanucleus 会查看其中的内部并执行一些字节码操作以增强
javascript - 增强 JavaScript 代码的技巧
正在使用 css3 转换进行漂亮的导航。为此还编写了一些 javascript。但不幸的是它看起来有点凌乱。你们能给我一些优化 javascript 代码的技巧吗？笔--> http://code
buildr - 增强 Builder 发布流程
我想将自定义任务绑定(bind)到默认构建器发布周期中。我想在项目编译、打包、标记和部署之后但在增加版本号并提交之前运行此代码。我将如何融入发布周期的这一部分？最佳答案不幸的是，release
elasticsearch - 基于某些字段的ElasticSearch结果排序(相关分数)(增强)
我使用ElasticSearch 6.6。我的应用程序通过从不同数据源提取数据来构建ES索引。搜索未指定数据源。它只是建立一个类似的查询: GET employerdata/_search { "
c++ - 增强::精神::保持空白
我正在使用此代码将“k1 = v1; k2 = v2; k3 = v3; kn = vn”字符串解析为映射。 qi::phrase_parse( begin,end,
java - 增强 for 循环上的 ArrayIndexOutOfBounds
我正在试图弄清楚作业的一部分，但我已经把头撞在墙上有一段时间了。我正在尝试将 DNA 序列转录为 RNA 序列。然而，我收到了 ArrayOutOfBoundsException。我不熟悉使用增强的
python - 增强 GAE 错误报告以包含警告
我需要对基于 python Google App Engine 的应用程序的警告进行分类。我从 GAE stackdriver 下载日志。我认为 GAE Stackdriver 错误报告位于 http
python - 增强 is_valid() 但有异常
我有一个 django charField，通过 is_valid() 方法进行检查。用户应该在此字段中输入有效的逻辑表达式，因此我编写了一个解析方法，如果表达式不正确，该方法会引发异常。如何增强
c - 增强 2 个函数以提供正确的输出
我编写了以下控制台应用程序，要求用户输入一天。我需要一些帮助才能改进，以便他们为一周中的所有日子提供正确的答案。如果用户输入除星期一以外的任何其他日期，则输出为“今天”、“昨天”、“明天”，并在这
javascript - ES6 中的模块模式错误(增强)
我在使用带有 ES6 let 关键字的模块模式(扩充)时遇到错误。这有效。 var Example = ( Example => { Example.name = ""; retur
java - 线程 - 增强 - java
我只是问是否线程安全可以使用我明确指出“doSomething()”是线程安全的。最佳答案线程安全取决于您正在迭代的 Collection，而不是 enhanced for 的使用。如果 Col
javascript - 增强 Jquery 拖放演示
我有一个非常符合 this Jquery demo 的要求，这是一个简单的购物车演示。基本上，我需要对该演示进行两项改进。我需要文本输入以及可用的“产品”。因此，当我拖放其中一种产品时，文本字段应随
mysql - 增强 SQL 查询的性能
我正在三个表 messages、message_recipients 和 users 上运行查询。 messages表的表结构: id int pk message_id int message te
java - Java 增强 for 循环中的隐式语句
这个问题已经有答案了: In detail, how does the 'for each' loop work in Java? (29 个回答) 已关闭 4 年前。由于增强的 for 循环是只读
jquery - 增强 gif 背景翻转的性能
我在 css 中制作了一个很酷的鼠标悬停，当父级鼠标悬停时它会显示动画 gif。这是我的代码:http://codepen.io/clemeeent/pen/oggzMa 问题是我将有大约 40 天
javascript - 增强 Knockout 中的数组项上下文
目前，当使用 Knockout foreach 绑定(bind)时，您可以使用 $index 访问当前索引。我想让其他类似的功能可用于我的内部绑定(bind) - 例如: array(让我访问正在操作

首页

博学

6Ren·AI

商城

python - 增强OCR的图像