ocr - 通过训练tesseract达到更好的识别效果-6ren

ocr - 通过训练tesseract达到更好的识别效果

转载作者：行者123 更新时间：2023-12-01 05:03:30

30

4

我有一个关于使用 tesseract 获得更好的识别结果的问题。我正在使用 tesseract 来识别序列号。序列号仅由一种字体类型、字符 A-Z、0-9 组成，并以不同的大小和长度出现。

目前我能够正确识别大约 40% 的序列号图像。图像是通过手机相机拍摄的。因此图像质量不是最好的。

特殊问题字符是 8/B、5/6。因为我只识别序列号，所以我没有使用任何字典改进，每个字符都是独立识别的。

我的问题是:是否有人已经体验过通过训练 tesseract 获得更好的识别结果？需要多少张图片才能得到好的结果。

对于训练 tesseract，我应该使用打印后拍照的序列号，还是应该使用原始数字序列号，而不打印和拍照？

也许有人已经在这方面有经验了。

关于训练 tesseract:我已经用一些图像训练了 tesseract。因此，我打印了不同尺寸的所有字符，并正确地拍照和标记。角色5的示例训练照片

enter image description here

这是一个好/坏的训练示例吗？由于我只想识别单个字符而没有任何依赖性，因此我不必使用单词进行训练。

实际上，对于字符 B 8 6 5，我只用这些图像中的 3 个进行了训练，与原始英语 (eng) tesseract 数据库相比，这并没有产生更好的识别效果。

最好的问候，克里斯托夫

最佳答案

我目前正在开发一个 Sikuli 应用程序，它使用 Tesseract 从屏幕截图中读取文本(字符串和数字)。我发现实现准确性的最佳方法是在对屏幕截图执行 OCR 之前对其进行处理。但是，我正在阅读的大部分文本都是黑色背景上的绿色文本，因此这是我的首选解决方案。我用了Scalr's BufferedImage 中增加图像大小的方法:

BufferedImage bufImg = Scalr.resize(...)

它立即产生了更准确的结果，灰色背景上的黑色文本。然后我在创建新的 BufferedImage 时使用 BufferedImage 的选项 BufferedImage.TYPE_BYTE_GRAY 和 BufferedImage.TYPE_BYTE_BINARY 分别将图像处理为灰度和黑白。

按照这些步骤，Tesseract 在处理黑底绿字时的准确率从 30% 提高到 85% 左右，在处理白底黑字时的准确率几乎接近 100%。 (有时单词中的字母会被数字弄错，例如 hel10)
希望对您有所帮助!

关于ocr - 通过训练tesseract达到更好的识别效果，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31145200/

30

4

0

文章推荐： java - 限制我自己的小部件采用 SWT 中的任何尺寸集

文章推荐： jQuery 自动完成功能禁用文本区域中的向上/向下箭头。为什么？

文章推荐： java - 如何读取文件夹、计算文件数量并复制到新文件夹

文章推荐： jquery - 数据表 - 在表加载时仅显示输入框

javascript - 用jquery(而不是mootools)模拟这个 slider 效果【横向 Accordion 效果】
我可以使用 javascript 和其他所有东西，但在重新发明轮子之前，我想知道是否已经有一个类似的 jquery 插件，因为我想使用那个框架而不是 mootools。我没有钱的问题，特别是 5 欧
悬停关闭的 CSS 效果
我正在 React 应用程序中处理动画。我需要动画在悬停后开始工作。我尝试了 :hover:after css 但不起作用。将鼠标悬停在图像上后动画可以工作，但我需要在悬停后开始。将鼠标悬停在图像上
Jquery slider 效果
我正在使用 jQuery 在按钮单击时实现 slider 效果。我的代码是: $(document).ready(function() { $("#mybutton").click(functio
jQuery .slideRight 效果
我需要一个div标签在屏幕右侧滑出，如何使用jQuery获得这种效果？我一直在看这里:http://api.jquery.com/category/effects/sliding/而且这似乎不是我要找
iPhone页面 curl 效果
我正在使用此代码实现页面 curl 效果......它在模拟器和设备中工作正常......但它不是(setType:@“pageCurl”)苹果记录的api，这导致它被iPhone拒绝App Stor
WPF 效果 - 对文本
我见过各种关于 WPF 效果的引用，但它们似乎是针对位图的，而不是针对文本的。是否可以将除模糊或投影以外的效果应用于XAML中的TextBlock对象？我想要做的示例可能是轮廓笔划，或斜角/浮雕效果
WPF 效果 - 对文本
我见过各种关于 WPF 效果的引用，但它们似乎是针对位图的，而不是针对文本的。是否可以将除模糊或投影以外的效果应用于XAML中的TextBlock对象？我想要做的示例可能是轮廓笔划，或斜角/浮雕效果
css - 没有固定定位的假背景透明度/效果
我正在尝试模拟这种效果:http://meyerweb.com/eric/css/edge/complexspiral/demo.html在我的博客上:http://segment6.blogspot
JavaFX Accordion 效果
我尝试将样式应用到 Accordion Pane ，但遇到了问题。这行不通。 accordion.setEffect(new DropShadow(BlurType.ONE_PASS_BOX, Co
javascript - 数据表切换列可见性延迟/效果
关于 Datatables website 的教程足够清楚了: 在我告诉 Datatables 我正在谈论哪一列后，我只需将切换按钮放入: column.visible( ! column.visib
Jquery ScratchOut 效果
我正在寻找 scratchOut 效果，随便叫它什么。这是从前景中删除图像的效果，因此背景图像变得可见。我曾尝试使用 jquery 插件重新创建此效果，但它并不像我希望的那样流畅。有没有人有这种
Android实现文字和图片混排(文字环绕图片)效果
本文实例讲述了android实现文字和图片混排(文字环绕图片)效果。分享给大家供大家参考，具体如下：在平时我们做项目中，或许有要对一张图片或者某一个东西进行文字和图片说明，这时候要求排版美观，所
Javafx简单实现【我的电脑资源管理器】效果
本文实例讲述了Javafx简单实现【我的电脑资源管理器】效果。分享给大家供大家参考。具体如下： 1. java代码： ?
angular - 服务循环的 ngrx 效果
我是 ngrx 的新手，正在尝试让我的 ngrx 商店的 @Effect 函数正常工作。下面的代码显示了如果我没有使用 ngrx 商店，服务是如何工作的。我首先调用 http.get 来获取列表，然后
ffmpeg - 如何在不对视频应用图像蒙版的情况下创建圆形视频(视频顶部的透明区域)效果
基本上我搜索了很多，解决方案建议应用一些 PNG 掩码或不提供所需的解决方案。我发现了什么。 ffmpeg -i main.mkv -i facecloseup.mkv -filter_compl
rxjs - 需要帮助理解这个 Ngrx 效果
有关使用从商店中选择的状态的效果的 Ngrx 文档状态(没有双关语意) Note: For performance reasons, use a flattening operator like co
c# - 如何在数据网格控件中利用 WPF 效果？
我有一个数据网格控件，我在其中使用名为 FastShadow 的自定义效果，它就像一个光晕。我希望效果在其边界之外发光，这样很好，但是当我在顶部绘制另一个形状时，我不希望这个形状受到影响。在本例中，
css - 从单个元素中移除 CSS 效果
除了子 div.exception 中的所有内容，我想将 div.main 中的所有文本设为灰色。 div.exception 应该看起来好像类 main 从未添加到父 div。这可能吗？如果是这样
flutter - 使用pdf文件的页面 curl 效果
我有一个 PDF 文件，我想重现此包页面中的页面 curl 效果: https://pub.flutter-io.cn/packages/page_turn 我试过用这个 page_turn插件，它需
rxjs - 延迟测试 NGRX 效果
我想测试一个效果如下: 如果调度了 LoadEntriesSucces 操作，则效果开始等待 5 秒 5 秒后发送 http 请求当响应到达时，将分派(dispatch)新的操作(取决于响应是成功

首页

博学

6Ren·AI

商城

ocr - 通过训练tesseract达到更好的识别效果