pattern-matching - 使用预定义的字体图像训练 "tesseract ocr"-6ren

pattern-matching - 使用预定义的字体图像训练 "tesseract ocr"

转载作者：行者123 更新时间：2023-12-04 08:29:22

我正在尝试对图像中的 ASCII 字符串进行 OCR 识别。我正在使用 Tesseract3 库，但是我在正确识别方面遇到了一些问题，因此我需要使用新字符集(这是特定的)对其进行训练。
我已经发现了这个操作方法:TrainingTesseract3 ，但是教程有一些我不需要的不必要的程序，因为我的图像测试集很简单。
我的图像数据集仅包含 1 衬垫 ，其中每个 ASCII 字符是同在所有图像中(无旋转，无缩放)，但行中字符之间的距离可变(仅水平)。

如何使用字体图像来训练识别算法？

最佳答案

先生只需获取您想要训练的特定字体，然后在记事本中写下字母或数字(我认为 5 个代表/字母)另存为 tiff 文件。如果您想训练它，请使用此 https://code.google.com/p/serak-tesseract-trainer/ 中的任何一个或 http://vietocr.sourceforge.net/training.html .

关于pattern-matching - 使用预定义的字体图像训练 "tesseract ocr"，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24063870/

文章推荐： jupyter-notebook - 列出 jupyter 实验室的运行实例

文章推荐： sql - 使用UNION时，是否保证SQL查询可以原子执行？

文章推荐： android-activity - Android 中的动态表单生成器

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

pattern-matching - 使用预定义的字体图像训练 "tesseract ocr"