作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试对图像中的 ASCII 字符串进行 OCR 识别。我正在使用 Tesseract3 库,但是我在正确识别方面遇到了一些问题,因此我需要使用新字符集(这是特定的)对其进行训练。
我已经发现了这个操作方法:TrainingTesseract3 ,但是教程有一些我不需要的不必要的程序,因为我的图像测试集很简单。
我的图像数据集仅包含 1 衬垫 ,其中每个 ASCII 字符是 同 在所有图像中(无旋转,无缩放),但行中字符之间的距离可变(仅水平)。
如何使用字体图像来训练识别算法?
最佳答案
先生只需获取您想要训练的特定字体,然后在记事本中写下字母或数字(我认为 5 个代表/字母)另存为 tiff 文件。如果您想训练它,请使用此 https://code.google.com/p/serak-tesseract-trainer/ 中的任何一个或 http://vietocr.sourceforge.net/training.html .
关于pattern-matching - 使用预定义的字体图像训练 "tesseract ocr",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24063870/
我是一名优秀的程序员,十分优秀!