gpt4 book ai didi

java - 如何用三种不同的笔迹训练相同数字的tesseract-ocr?

转载 作者:太空宇宙 更新时间:2023-11-04 12:01:04 25 4
gpt4 key购买 nike

我用java编写了一个程序,它从扫描的tiff图像中读取字符,但准确性不太好。

如果我们更改文档中的笔迹,结果会略有不同。那么有没有什么方法可以训练tesseract-ocr呢?

我也使用了jtessEditorBox,但里面没有任何帮助。

最佳答案

我建议你挖掘这篇文章: http://www.tuxrincon.com/blog/training-tesseract-ocr/

获取每个笔迹的图片。使用“QT Box Editor”在多张图片上将框与字符相关联。然后将它们交给 tesseract,以便使用“train.sh”脚本对其进行训练(可能会纠正其中的一些错误)。我没有使用“train2.sh”,因为它在我的情况下似乎适得其反。将所有笔迹训练数据文件添加到 tesseract 配置文件中。您可以更改“QT Box Editor”配置以将您的手写设置为不同的语言。

关于java - 如何用三种不同的笔迹训练相同数字的tesseract-ocr?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40905276/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com