gpt4 book ai didi

python - 如何提高python中扫描图像中文本的分辨率?

转载 作者:行者123 更新时间:2023-12-03 09:31:00 25 4
gpt4 key购买 nike

我使用 tesseract-OCR 从扫描图像中提取文本,对于少数图像,由于分辨率低而无法正确识别文本,并且产生的输出是一些不相关的字符。

应用技术:

  • 将 dpi 增加到 300。
  • opencv 中的图像预处理技术。
  • 在 opencv 中使用 dnn_superres 放大图像
  • 降噪技术。
  • 引用 git repos,其中使用深度学习开发了超分辨率算法模型。
  • 通过训练 tessdata 提高 tesseract-ocr 质量。

  • 引用链接 :
  • Improve OCR accuracy from scanned documents
  • image processing to improve tesseract OCR accuracy

  • 示例图像:

    enter image description here

    python中有没有什么简单的方法可以在不使用任何深度学习模型的情况下改进文本。

    最佳答案

    我知道您更喜欢使用深度学习来放大这些输入图像,但我强烈建议您尝试使用 https://github.com/alexjc/neural-enhance ,假设您有合适的硬件来运行神经网络和深度学习。

    您的 OCR 输入图像的结果可能很有希望。代码的文档非常丰富。

    希望这对你有帮助!

    关于python - 如何提高python中扫描图像中文本的分辨率?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61676455/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com