image-processing - 使用 leptonica 进行 OCR 图像处理(反色文本)-6ren

image-processing - 使用 leptonica 进行 OCR 图像处理(反色文本)

转载作者：行者123 更新时间：2023-12-03 23:46:19

24

4

我正在尝试使用 leptonica 处理以下图像以使用 tesseract 提取文本。

原始图片:
original image

原始图像上的 Tesseract 产生以下结果:

i s l
D2J1FiiE-l191x1iitmwii9 uhiaiislz-2 Q ~37
Bottom linez
With a little time!
you can learn social media technology
using free online resources-
And if you donity
youlll be at a significant disadvantage
to
other HOn-pFOiiTS-

不是很好，尤其是顶部背景。因此，使用 leptionica 我使用背景去除算法(模糊、差异、阈值、反转)来获得以下图像:
processed image

但是 tesseract 并没有很好地处理它:

@@r-mair lkrm@W lh@w ilr@ mJs@ iklh@ ii@c2lhm1@ll
mm Mime
VWU1 a Mitt-Jle time-
@1m ll@@Wn Om @@@lh1
using free onhne resources-
Andifyoudoni
9110 ate a $0 D
to other non-profrts
I

主要的问题似乎是，现在所有的文本都是轮廓而不是实体。我如何调整我的算法或者我可以添加什么来使文本变得坚固？

最佳答案

看来this paper提出了一种解决您问题的二值化方法:

T Kasar、J Kumar 和 A G Ramakrishnan。 Font and Background Color Independent Text Binarization . (2007)

Kasar etal method performance

关于image-processing - 使用 leptonica 进行 OCR 图像处理(反色文本)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11678542/

24

4

0

文章推荐： .net - .NET 库中是否有稀疏数组实现？

文章推荐： reactjs - 我什么时候应该通过 'className' Prop 来 react 组件？

文章推荐： python - 如何在python中制作带有选择的弹出窗口？

文章推荐： .net - 如何在 AutoFac 中创建可选依赖项？

[图像处理]基于CleanVision库清洗图像数据集
CleanVision是一个开源的Python库，旨在帮助用户自动检测图像数据集中可能影响机器学习项目的常见问题。该库被设计为计算机视觉项目的初步工具，以便在应用机器学习之前发现并解决数据集中的问题。
java - 图像处理
我只是想知道需要什么样的计算/编程语言/框架来生成图像，例如 http://www.erdas.com/ 中的图像。 ? 以编程方式，如何生成一般空间分析图像？ ps:我大部分时间都在使用java。
Grails 图像处理
我尝试在我的 grails 项目(Mac OS X 上的 1.1.1)中使用一些图像处理插件或 java 库:imageTools 插件、imageJ、awt 库等。每次我从路径打开/获取图像以启动进
Java 图像处理
我有一个项目，我必须以多种方式处理图像。我陷入了像素化的困境。对于像素化，我必须采用一组 10x10 像素并返回一个单独平均 RGB 颜色的单元格。目前我在运行程序中得到的只是一个红色图像。谢谢您的
java - 图像处理
就目前情况而言，这个问题不太适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、民意调查或扩展讨论。如果您觉得这个问题可以改进并可能重新开放，visit
python - 图像处理
这是一项作业，因为我是Python编程新手，所以我付出了很大的努力: 我正在运行以下函数，它接受图像和短语(空格将被删除，因此只有文本)作为参数，我已经获得了所有导入和预处理代码，我只需要实现这个函数
c++ - 图像处理
关闭。这个问题需要更多focused .它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 8 年前。 Improve this qu
c# - 图像处理
我需要一种简单易学且快速的方法来从背景图像、文本生成图像，然后保存为 JPEG 格式。您有什么建议？有关于此的任何图书馆或教程吗？重要的标准是简单。最佳答案在 .Net 3.5/4 中，您还可以
iphone, 图像处理
我正在构建一个夜视应用程序，但我没有找到任何有用的算法可以应用于黑暗图像以使其清晰。任何人请给我一些好的算法。提前致谢最佳答案由于 iphone 镜头和传感器的尺寸，无论您做什么，都会有很多噪音
C++ 图像处理
所以我为游戏制作了这个程序，需要帮助让它更自动化一些。程序接收图像然后显示它。我正在对 OpenGL 中的纹理执行此操作。当我截取游戏截图时，它通常约为 700x400。我将高度和宽度输入到我的程序
java - 图像处理
我想更改图像中像素的值，为此我需要将图像存储为矩阵。我怎样才能完成这项工作？请指导。最佳答案 BufferedImage image = ImageIO.read(..); image.setRGB
php - 用图像替换帧中检测到的对象。(图像处理)
概述: 我正在做一个视频创作项目。我使用的技术有:imageMagick、php、ffmpeg。当前状态: 目前，该项目能够使用图像和文本以及很少的基本过渡来创建视频。我这样做的方式是使用 imag
php - 图像处理 PHP
我正在创建 facebook 应用程序，其中我将用户图像作为背景图像，并有一个用户可以四处移动的默认大写图像。用户将叠加图像(一顶帽子)放在正确的位置后，他点击保存这就是我感到震惊的地方，我想知道如
javascript - 图像处理/JavaScript
我正在尝试编写一个 JavaScript 程序，通过在图像上放置三个垂直条纹来修改图像。左边三分之一是红色条纹，中间是绿色条纹，右边三分之一是蓝色条纹。这是我试图实现的算法:1. 从您要更改的图像开
image - [图像处理]阈值不能忽略透明像素
目前，我正在尝试通过图像分割方法将面部和头发修剪在一起，然后将所有非彩色像素设置为透明，然后尝试使用Binary Threshold技术和Adaptive Threshold。但是我得到了不希望的结果
android - 图像处理:在打开的书中查找突出的页面并进行透视变换
我必须使此图像Book Image To Process的页面标题为:“单元3:主动学习的秘诀”，使其成为图像中的唯一页面为此，我需要删除也在图像中的其他页面的一部分我需要编写一个通用代码，可以对
opencv - 如何仅放大图像的几个点，图像处理
我正在研究一个问题，其中我缩小图像的尺寸，在缩小图像中找到类似于二进制图像的有趣点。现在我只想放大在缩小图像中找到的有趣点(即白色像素点)，而不是放大整个图像然后找到有趣的点。哪种技术可以最好地用于此
python - 图像处理:道路提取
Closed. This question needs debugging details。它当前不接受答案。想改善这个问题吗？更新问题，以便将其作为on-topic用于堆栈溢出。上个月关闭。 I
python - 从文本图像中删除分界 - 图像处理
嗨，我需要编写一个程序，从灰度图像中删除分界(图像中带有文本) 我阅读了有关阈值和模糊的信息，但我仍然不知道该怎么做。我的图像是这样的希伯来文本图像: 我需要删除分界线(假设分界线是图像中的最小元素
Python 图像处理 - 如何删除某些轮廓并将值与周围像素混合？
我正在做一个带有深度图像的项目。但是我的深度相机有噪音和像素读取失败的问题。有一些点和轮廓(尤其是边缘)的值为零。如何忽略这个零值并将其与周围的值混合？我试过 dilation和 erosion (

首页

博学

6Ren·AI

商城

image-processing - 使用 leptonica 进行 OCR 图像处理(反色文本)