gpt4 book ai didi

ocr - 用于文档OCR/可读性的图像处理/增强算法?

转载 作者:行者123 更新时间:2023-12-04 03:47:29 25 4
gpt4 key购买 nike

我正在寻找算法,文件或软件来增强传真,手机摄像头的图像以及其他类似的可读性和OCR来源。

我主要对简单的增强功能(例如,可以使用ImageMagick进行的操作)感兴趣,但对更复杂的技术也很感兴趣。我已经在与供应商交流,因此对于这个问题,我主要是在寻找算法或开源软件。

进一步说明:我不是在寻找OCR软件或算法;我正在寻找清除图像的算法,以使人眼看起来更易读,并且可以用于OCR。

最佳答案

当我编写一些软件来进行书籍扫描时,我遇到了类似的问题。在互联网上 float 的是一个名为pagetools的程序,该程序使用一种称为Radon变换的相当聪明的数学技巧来拉直扫描的页面。

我还编写了一个小例程,该例程将页面上的空白留白。 OCR算法在不必与背景噪声抗衡时,往往会做得更好。我所做的就是寻找浅色像素,该像素距深色像素的半径要小一些,然后将其提升为纯白色。

但是已经过去了几年,所以我没有方便的确切实现细节。

关于ocr - 用于文档OCR/可读性的图像处理/增强算法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/715240/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com