gpt4 book ai didi

testing - 如何为 OCR 软件提供最大的成功机会?

转载 作者:行者123 更新时间:2023-11-28 20:10:04 25 4
gpt4 key购买 nike

我正在使用 Tesseract OCR (通过 pytesser )和 PIL(Python 图像库)对应用程序进行自动化测试。

我正在通过制作屏幕截图并通过 tesseract 获取文本来检查显示的文本是否正常。

一开始我遇到了一些问题,由于 PIL 的双三次插值,我增加了屏幕截图的大小,因此它似乎工作得更好。

不幸的是,我仍然有一些错误,比如混淆了'0'和'O'。我可以想象我以后还会有其他类似的问题。

我想知道是否有一些技术可以准备图像以帮助 OCR。欢迎任何想法。

提前致谢

最佳答案

不要脸的外挂和免责声明:my company用于 .NET 的 Tesseract 包

Tesseract 是一个不错的 OCR 引擎。它可能会遗漏很多内容,并且很容易被非文本混淆。你能为它做的最好的事情就是确保它只获取文本。下一个最好的办法是给它一些理智的二值化(到达那里的自适应或动态阈值)或灰度并让它尝试进行二值化。

关于testing - 如何为 OCR 软件提供最大的成功机会?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1335581/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com