gpt4 book ai didi

machine-learning - 使用 python 进行 tesseract ocr 的最佳实践

转载 作者:行者123 更新时间:2023-11-30 09:14:57 25 4
gpt4 key购买 nike

我正在开发一个项目,我想从信用卡大小的文档中识别文本。该文档包含姓名、电话号码、地址等详细信息。我正在捕获图像并将图像传递到超正方体引擎中使用text = pytesseract.image_to_string(Image.open(filename), lang = 'eng')。有时我在每个领域都取得了不错的成绩,但大多数时候结果都很糟糕。我该如何解决这个问题?最佳实践是什么?文档阅读器如何使用 OCR。是否可以在文档中处理基于区域的 ocr?

最佳答案

单一方法无法读取所有文本。您必须对多种类型的 pdf 应用多种方法。

如果文本不是水平的,则必须旋转文本。如果文本是弯曲的,则必须使用变换(例如 hog 变换)。

此外,要使用该包阅读文本,文本应该清晰且水平。否则,您需要创建规则并对其进行转换。

关于machine-learning - 使用 python 进行 tesseract ocr 的最佳实践,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58394604/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com