gpt4 book ai didi

ocr - 当数字与字母混合时,如何使超立方体仅识别数字?

转载 作者:行者123 更新时间:2023-12-02 00:13:22 28 4
gpt4 key购买 nike

我想使用 tesseract 来仅识别数字。问题是我混合了数字和字母,当我使用 SetVariable("tessedit_char_whitelist", "0123456789")
对于每个符号,超立方体都会返回错误的数字。

我可以设置一个阈值,以便tesseract忽略相似度较低的符号吗?

注意:我将 tesseract 设置为仅识别数字,这样 O 和 0 之间就不会混淆。

最佳答案

仅识别数字实际上在 tesseract FAQ 上得到了解答。页。请参阅该页面以获取更多信息,但如果您有版本 3 软件包,则配置文件已设置完毕。您只需在命令行上指定:

tesseract image.tif outputbase nobatch digits

至于阈值,我不确定你的意思。如果您的输入是不寻常的字体,也许您可​​以使用输入的样本进行重新训练。另一种方法是更改​​ tesseract 的修剪阈值。常见问题解答中也提到了这两个选项。

关于ocr - 当数字与字母混合时,如何使超立方体仅识别数字?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4944830/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com