gpt4 book ai didi

ocr - 针对特定单词训练 Tesseract - 可能吗?

转载 作者:行者123 更新时间:2023-12-04 00:41:09 25 4
gpt4 key购买 nike

我想使用 Tesseract 从文档中提取大约 10-20 个关键字。该文件将包含所有英文字符/单词。我感兴趣的是“年龄:23​​”之类的东西。这里 Age 是我感兴趣的关键字,并且还想提取 23(它的值)。

我想到的第一种方法是将整个页面提取为文本,然后在识别的文本中查找关键字。但是在训练tesseract方面,如果我知道关键字,是否有更好的方法,这可能会导致更好的准确性?

我或多或少知道 Tesseract OCR 的局限性。试图在该限制内最大化。感谢您的所有专家建议。

最佳答案

试试 bazaar Tesseract 中的匹配模式。

关于ocr - 针对特定单词训练 Tesseract - 可能吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18674061/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com