gpt4 book ai didi

image-processing - 图像处理以提高 tesseract OCR 准确性

转载 作者:行者123 更新时间:2023-12-03 04:31:13 24 4
gpt4 key购买 nike

我一直在使用 tesseract 将文档转换为文本。文档的质量参差不齐,我正在寻找有关哪种图像处理可以改善结果的提示。我注意到高度像素化的文本(例如由传真机生成的文本)对于超立方体来说尤其难以处理——大概所有这些字符的锯齿状边缘都会混淆形状识别算法。

什么样的图像处理技术可以提高准确性?我一直在使用高斯模糊来平滑像素化图像并看到一些小的改进,但我希望有一种更具体的技术可以产生更好的结果。假设一个滤镜被调整为黑白图像,它会平滑不规则的边缘,然后是一个滤镜,它会增加对比度以使字符更加清晰。

对于图像处理新手有什么一般建议吗?

最佳答案

  1. 修复 DPI(如果需要)最低 300 DPI
  2. 修复文本大小(例如 12 磅应该可以)
  3. 尝试修复文本行(纠偏和扭曲文本)
  4. 尝试修复图像的照明(例如,没有图像的黑暗部分)
  5. 对图像进行二值化和去噪

没有适合所有情况的通用命令行(有时您需要模糊和锐化图像)。但你可以尝试一下TEXTCLEANER from Fred's ImageMagick Scripts .

如果你不喜欢命令行,也许你可以尝试使用开源 scantailor.sourceforge.net或商业bookrestorer .

关于image-processing - 图像处理以提高 tesseract OCR 准确性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9480013/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com