gpt4 book ai didi

c# - 用于屏幕文本的 OCR(光学字符识别)

转载 作者:行者123 更新时间:2023-11-30 13:05:58 34 4
gpt4 key购买 nike

我正在尝试创建一款软件,通过捕获屏幕截图来自动化 PC,然后使用 OCR(光学字符识别)寻找要单击的特定按钮(例如)。我有鼠标和键盘控制部分,但现在,我需要一个 OCR 来处理屏幕截图。我发现 Tesseract OCR 似乎不能很好地处理屏幕上的文本。文本太小,或者某些文本似乎是相连的,例如 K 和 X。我应该怎么做?

p/s:这是一个自动化测试程序。

最佳答案

我不确定这是否真的适合您,但我在自动化中看到的一些更好的 OCR 是由 Tevron 的 CitraTest 完成的.它包含一个字体库,如果不存在字体集,他们将根据您提交的内容创建一个新字体集。使用此工具的负面因素是成本和与可变屏幕分辨率相关的常见问题。

关于c# - 用于屏幕文本的 OCR(光学字符识别),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/896224/

34 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com