gpt4 book ai didi

image-processing - 图像处理以提高 tesseract OCR 准确性

转载 作者:行者123 更新时间:2023-12-05 00:07:30 28 4
gpt4 key购买 nike

我一直在使用 tesseract 将文档转换为文本。文档的质量参差不齐,我正在寻找关于哪种图像处理可以改善结果的提示。我注意到高度像素化的文本——例如由传真机生成的文本——对于 tesseract 来说特别难以处理——大概所有这些字符的锯齿状边缘都会混淆形状识别算法。

什么样的图像处理技术可以提高准确性?我一直在使用高斯模糊来平滑像素化图像并看到一些小的改进,但我希望有一种更具体的技术可以产生更好的结果。比如说一个针对黑白图像调整的滤镜,它可以平滑不规则的边缘,然后是一个可以增加对比度以使字符更加清晰的滤镜。

对于图像处理的新手,有什么一般提示吗?

最佳答案

  1. 修复 DPI(如果需要)最低 300 DPI
  2. 固定文本大小(例如 12 pt 应该没问题)
  3. 尝试修复文本行(去歪斜和去扭曲文本)
  4. 尝试修复图像的照明(例如图像没有暗部)
  5. 图像二值化和去噪

没有适合所有情况的通用命令行(有时您需要模糊和锐化图像)。但是你可以试试TEXTCLEANER from Fred's ImageMagick Scripts .

如果您不喜欢命令行,也许您可​​以尝试使用开源 scantailor.sourceforge.net或商业 bookrestorer .

关于image-processing - 图像处理以提高 tesseract OCR 准确性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17188407/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com