- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个关于使用 tesseract 获得更好的识别结果的问题。我正在使用 tesseract 来识别序列号。序列号仅由一种字体类型、字符 A-Z、0-9 组成,并以不同的大小和长度出现。
目前我能够正确识别大约 40% 的序列号图像。图像是通过手机相机拍摄的。因此图像质量不是最好的。
特殊问题字符是 8/B、5/6。因为我只识别序列号,所以我没有使用任何字典改进,每个字符都是独立识别的。
我的问题是:是否有人已经体验过通过训练 tesseract 获得更好的识别结果?需要多少张图片才能得到好的结果。
对于训练 tesseract,我应该使用打印后拍照的序列号,还是应该使用原始数字序列号,而不打印和拍照?
也许有人已经在这方面有经验了。
关于训练 tesseract:我已经用一些图像训练了 tesseract。因此,我打印了不同尺寸的所有字符,并正确地拍照和标记。角色5的示例训练照片
这是一个好/坏的训练示例吗?由于我只想识别单个字符而没有任何依赖性,因此我不必使用单词进行训练。
实际上,对于字符 B 8 6 5,我只用这些图像中的 3 个进行了训练,与原始英语 (eng) tesseract 数据库相比,这并没有产生更好的识别效果。
最好的问候,克里斯托夫
最佳答案
我目前正在开发一个 Sikuli 应用程序,它使用 Tesseract 从屏幕截图中读取文本(字符串和数字)。我发现实现准确性的最佳方法是在对屏幕截图执行 OCR 之前对其进行处理。但是,我正在阅读的大部分文本都是黑色背景上的绿色文本,因此这是我的首选解决方案。我用了Scalr's BufferedImage 中增加图像大小的方法:
BufferedImage bufImg = Scalr.resize(...)
它立即产生了更准确的结果,灰色背景上的黑色文本。然后我在创建新的 BufferedImage 时使用 BufferedImage 的选项 BufferedImage.TYPE_BYTE_GRAY
和 BufferedImage.TYPE_BYTE_BINARY
分别将图像处理为灰度和黑白。
按照这些步骤,Tesseract 在处理黑底绿字时的准确率从 30% 提高到 85% 左右,在处理白底黑字时的准确率几乎接近 100%。 (有时单词中的字母会被数字弄错,例如 hel10)
希望对您有所帮助!
关于ocr - 通过训练tesseract达到更好的识别效果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31145200/
我可以使用 javascript 和其他所有东西,但在重新发明轮子之前,我想知道是否已经有一个类似的 jquery 插件,因为我想使用那个框架而不是 mootools。 我没有钱的问题,特别是 5 欧
我正在 React 应用程序中处理动画。我需要动画在悬停 后开始工作。我尝试了 :hover:after css 但不起作用。将鼠标悬停在图像上后动画可以工作,但我需要在悬停后开始。将鼠标悬停在图像上
我正在使用 jQuery 在按钮单击时实现 slider 效果。我的代码是: $(document).ready(function() { $("#mybutton").click(functio
我需要一个div标签在屏幕右侧滑出,如何使用jQuery获得这种效果?我一直在看这里:http://api.jquery.com/category/effects/sliding/而且这似乎不是我要找
我正在使用此代码实现页面 curl 效果......它在模拟器和设备中工作正常......但它不是(setType:@“pageCurl”)苹果记录的api,这导致它被iPhone拒绝App Stor
我见过各种关于 WPF 效果的引用,但它们似乎是针对位图的,而不是针对文本的。是否可以将除模糊或投影以外的效果应用于XAML中的TextBlock对象? 我想要做的示例可能是轮廓笔划,或斜角/浮雕效果
我见过各种关于 WPF 效果的引用,但它们似乎是针对位图的,而不是针对文本的。是否可以将除模糊或投影以外的效果应用于XAML中的TextBlock对象? 我想要做的示例可能是轮廓笔划,或斜角/浮雕效果
我正在尝试模拟这种效果:http://meyerweb.com/eric/css/edge/complexspiral/demo.html在我的博客上:http://segment6.blogspot
我尝试将样式应用到 Accordion Pane ,但遇到了问题。 这行不通。 accordion.setEffect(new DropShadow(BlurType.ONE_PASS_BOX, Co
关于 Datatables website 的教程足够清楚了: 在我告诉 Datatables 我正在谈论哪一列后,我只需将切换按钮放入: column.visible( ! column.visib
我正在寻找 scratchOut 效果,随便叫它什么。 这是从前景中删除图像的效果,因此背景图像变得可见。 我曾尝试使用 jquery 插件重新创建此效果,但它并不像我希望的那样流畅。 有没有人有这种
本文实例讲述了android实现文字和图片混排(文字环绕图片)效果。分享给大家供大家参考,具体如下: 在平时我们做项目中,或许有要对一张图片或者某一个东西进行文字和图片说明,这时候要求排版美观,所
本文实例讲述了Javafx简单实现【我的电脑资源管理器】效果。分享给大家供大家参考。具体如下: 1. java代码: ?
我是 ngrx 的新手,正在尝试让我的 ngrx 商店的 @Effect 函数正常工作。下面的代码显示了如果我没有使用 ngrx 商店,服务是如何工作的。我首先调用 http.get 来获取列表,然后
基本上我搜索了很多,解决方案建议应用一些 PNG 掩码或不提供所需的解决方案。 我发现了什么。 ffmpeg -i main.mkv -i facecloseup.mkv -filter_compl
有关使用从商店中选择的状态的效果的 Ngrx 文档状态(没有双关语意) Note: For performance reasons, use a flattening operator like co
我有一个数据网格控件,我在其中使用名为 FastShadow 的自定义效果,它就像一个光晕。 我希望效果在其边界之外发光,这样很好,但是当我在顶部绘制另一个形状时,我不希望这个形状受到影响。在本例中,
除了子 div.exception 中的所有内容,我想将 div.main 中的所有文本设为灰色。 div.exception 应该看起来好像类 main 从未添加到父 div。 这可能吗?如果是这样
我有一个 PDF 文件,我想重现此包页面中的页面 curl 效果: https://pub.flutter-io.cn/packages/page_turn 我试过用这个 page_turn插件,它需
我想测试一个效果如下: 如果调度了 LoadEntriesSucces 操作,则效果开始 等待 5 秒 5 秒后发送 http 请求 当响应到达时,将分派(dispatch)新的操作(取决于响应是成功
我是一名优秀的程序员,十分优秀!