gpt4 book ai didi

python - 在python中从屏幕中提取文本

转载 作者:太空宇宙 更新时间:2023-11-03 11:33:02 24 4
gpt4 key购买 nike

是否有用于从 png 位图屏幕截图中提取文本的库等?

它用于自动化器并且(例如)能够读取按钮等。我检查了 Tesseract,但它似乎是为图片而不是计算机屏幕字体制作的。

最佳答案

如果您正在处理少量可能的匹配项(即:您想要识别两个或三个不同的按钮),最简单的方法是将之前的屏幕截图中的匹配项分离出来,将它们保存到单独的文件中,然后使用某种形式的模板匹配,即 quite easy in opencv .

但是,如果您需要实际执行按钮文本的识别,您将需要一个 OCR 引擎。如果可以的话,Tesseract 是一个不错的选择 get it trained for your font (这是一个漫长的过程)。正如您所提到的,如果您正在处理一种小字体,您将需要 执行此操作,而 tesseract 最初并未接受过识别训练。如果你不能,还有一些其他引擎可以在 python 中使用,比如 Ocropus

关于python - 在python中从屏幕中提取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13368259/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com