ocr - 如何使 tesseract 在存在噪声的情况下给出相关结果？-6ren

ocr - 如何使 tesseract 在存在噪声的情况下给出相关结果？

转载作者：行者123 更新时间：2023-12-04 13:49:43

26

4

我正在使用 tesseract 3.0.0，我遇到了以下问题:

当某物太小以至于 tesseract 无法识别时，它似乎与其他片段。因此，不会返回任何相关内容。

下图显示了 3 个案例。只有带有虚线的矩形被传递给 tesseract。矩形上方是结果(V over T 表示换行)。

最后一个案例是有问题的。在这种情况下有什么办法可以改进 tesseract 吗？

enter image description here

最佳答案

据我所知，Tesseract 还没有适当的图像分割(或文档分析，因为它在商业 OCR 应用程序中被称为。)通常，在 OCR 完成之前，图像会在包含文本的单独区域上分割，图片、条码、线条等。然后，您仅将 OCR 应用于文本区域，而不会遇到您刚才描述的问题。

Tesseract 的早期版本根本没有该功能，并且 Tesseract 应该仅用作行识别器，或所谓的字段级识别器，当您将它用于从大图像剪切的小文本片段时。

我没有完全遵循 3.0 中引入的内容，可能它已经部分存在，但显然它没有按预期工作，正如您刚刚发现的那样。

还有另一个开源项目 - OCRopus，它完全按照我的描述解决了这个问题 - 首先是 Document Analisys(又名 Segmentation)，然后才是 OCR。他们的早期版本实际上是在分析步骤完成后使用 Tesseract 进行 OCR。但后来他们引入了自己的 OCR(仍然不是很好)并将 Tesseract 插件支持移到了优先级列表中。

以下是您实际可以采取的措施来解决您的问题:

如果您的图像具有非常典型的结构，您可以尝试进行一些愚蠢的分割并在将图像传递给 Tesseract 之前自己从图像中剪切文本。但是，如果您希望支持各种各样的图像，那就算了。
您可以检查 OCRopus 并查看它们的分割是否适用于您的图像。如果是，那么您可以花一些时间让 OCRopus + Tesseract 协同工作。
好吧，如果您所做的不仅仅是为了好玩而且您珍惜自己的时间，我建议您考虑像 ABBYY 这样的真正的 OCR 引擎。您将获得开箱即用的分割和 OCR 的更高准确性，当然还有专业的客户支持。

免责声明:我为 ABBYY 工作

关于ocr - 如何使 tesseract 在存在噪声的情况下给出相关结果？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/4945148/

26

4

0

文章推荐： scala - 使用空参数从Scala调用Java API

文章推荐： vim - 在VIM编辑器中，如何总是突出显示某些特定的单词？

文章推荐： jsf - setter 方法返回类型是否必须为 void？

OpenCV - 去除图像中不需要的小点/噪声
我正在研究我的论文，以构建乐谱(乐谱)识别系统。这是我的输入文件: 这是一些预处理和去除五线谱后的结果: 我在这里遇到的问题是，在五线谱删除步骤之后出现了一些超小的、不需要的“点”。这些点/噪声与实际
Git rebase 噪声
这可能是一个愚蠢的问题(当然)，但对于我已阅读/发现的所有内容，没有一个与我想做的相匹配......这是 GIT 的基本情况。为了使我的情况更简单，我有两个分支: - master(主要分支) -
filtering - 尝试过滤来自加速度计和陀螺仪的(大量)噪声
我的项目: 我正在开发一辆带有 3 轴加速度计和陀螺仪的槽车，试图估计汽车姿态(x、y、z、偏航、俯仰)，但我的振动噪音有一个大问题(而汽车在例如，加速度计的噪声值在 ±4[g](其中 g = 9.8
math - 用于地形生成的 Perlin 噪声
我正在尝试实现 2D Perlin 噪声来创建类似 Minecraft 的地形(Minecraft 实际上并不使用 2D Perlin 噪声)而没有悬垂或洞穴之类的东西。我这样做的方式是创建一个 [
python - 向图像添加 RMS 噪声
我有一个代表图像的二维数组。我必须向图像添加 RMS 2 单位的背景高斯噪声。我不熟悉噪声的 RMS 测量以及如何添加它。您能否告诉我如何执行此操作？最佳答案按照我的理解，您想要在每个像素处添加遵
用于二维地形生成的 Java Perlin 噪声
更新:正式问题列表: 2D 噪声实现的浮点值(输入参数和输出)代表什么？ - 部分回答，输入是坐标。输出怎么样？另外，我可以使用我的整数作为坐标的 float 吗？ 1.0、122.0 等？在 2D
algorithm - 如何在球面上生成 Perlin 噪声？
我正在尝试使用 Perlin 噪声生成地形。我了解如何使用笛卡尔坐标生成它，但无法完全理解它在球体上的工作方式。我知道您可以将 2D 表面投影到球体上，但失真不会扰乱噪声分布吗？要在球体表面生成均匀噪
C++0x 噪声、膨胀和可移植性
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
c++ - 不需要的常规 Perlin 噪声
我正在尝试将 fBm 实现到行星的球体上。为了创建我的球体，我将其从立方体转换为此类。不幸的是，生成的 fBm 显示为镜像补丁。此外，它只在 2 个面上执行(包装其他面的值)。当呈现为 sphere
image-processing - 单纯形噪声与 Perlin 噪声
我想知道为什么在 Simplex 推出后，Perlin 噪声至今仍然如此流行。单纯形噪声是由 Ken Perlin 自己制作的，它应该取代他的旧算法，该算法对于更高的维度来说速度较慢，但质量更好(
random - 改进的 Perlin 噪声 "too smooth"
我终于设法为 Love 2D 编写了 Perlin 改进噪音的工作 Lua 版本。但是，当我运行它时，我得到了这个: 我想这很好。但我想要看起来更像这样的东西: 我怎样才能做到这一点？最佳答案第一
random - 改进的 Perlin 噪声 "too smooth"
我终于设法为 Love 2D 编写了 Perlin 改进噪音的工作 Lua 版本。但是，当我运行它时，我得到了这个: 我想这很好。但我想要看起来更像这样的东西: 我怎样才能做到这一点？最佳答案第一
使用小数处理字节数组后的 Java Sound API 噪声
我正在尝试处理我从采样源数据行(Java Sound API)获得的字节数组。如果我将字节数组与小数相乘，播放流时会产生噪音。在播放声音之前，我将立体声 wav 文件分成左右声道。这很好用。但是，如
java - Java 中的 Perlin 噪声
对于我正在进行的元胞自动机项目，我需要使用不同的算法和技术随机生成二维 boolean 数组。目前，我在应用程序中只有一种随机化类型——循环遍历数组中的每个单元格并生成一个随机 double 变量，然
用于随机地形生成的 Java 2D Perlin 噪声
我叫 Chris，正在开发我的第一个 Java 游戏。到目前为止，我已经创建了一个基于图 block 的 2D 游戏，但是我的关卡是以这样一种方式完成的，如果我创建一个图像并且它全是绿色，那么绿色就代
c# - 如何在多个 perlin 噪声 block 之间平滑？
block 之间的平滑所以我一直在开发一个统一的游戏，想将我的世界从 150x150 的 map 扩展到一个看似无限的程序世界。我的计划是以Perlin Noise为基础，使用0-1的不同值来判断地
haskell - 在 Haskell 中优化 Perlin 噪声
(此程序的依赖项:vector --any 和 JuicyPixels >= 2 。代码可用作 Gist。) {-# LANGUAGE Haskell2010 #-} {-# LANGUAGE Ban
c# - Diamond-Square 算法不产生 "smooth"噪声
我最近用 C# 编写了 Diamond-Square 过程生成算法的实现。但是，生成的噪声在所处理的“正方形”之间具有非常明显的边界。伪代码看起来像这样 gen() { This takes
javascript - 我无法在 Javascript 中生成平滑的 Simplex 噪声
我已经尝试了所有方法并阅读了我在互联网上看到的关于 Perlin Noise 或 Simplex Noise 的每一个链接，甚至剖析了一些我认为工作正常的 Javascript 示例。但我仍然得到看
video - block 运动补偿编码器 - 如何处理引用帧中的 block 噪声？
我在任何方面都不精通视频压缩，但目前正在从事一个使用 H.264 压缩残差图像的项目我的问题更多是关于视频编码器的一般性问题。据我了解(正如维基百科所解释的那样)， block 运动补偿编码器将当前

首页

博学

6Ren·AI

商城

ocr - 如何使 tesseract 在存在噪声的情况下给出相关结果？