gpt4 book ai didi

neural-network - 如何制作 OCR 程序?

转载 作者:行者123 更新时间:2023-12-04 01:03:04 24 4
gpt4 key购买 nike

关闭。这个问题需要更多focused .它目前不接受答案。












想改善这个问题吗?更新问题,使其仅关注一个问题 editing this post .

去年关闭。




Improve this question




我想制作一个将图像作为输入并输出文本的程序。现在我知道我可以使用神经网络将单个字符的图像转换为该字符。困难的部分是:给定一个带有文本的图像,我将如何生成每个字符周围的所有矩形?我可以用什么方法来做到这一点?

最佳答案

一种基本方法是制作黑色像素的直方图。第一:将所有像素投影在一条线上。直方图中的深谷表示线之间的分离(如果纸张可能倾斜,请尝试不同的角度)。然后,每行(或每页,如果您知道字体是等宽的)将像素投影到水平直方图上。这将为您提供字符间空间的强烈指示。这至少会为您提供一个平均字符高度和宽度的值,这将有助于您进行后续步骤。

之后,您需要处理字距调整(字符重叠的地方)。找到连接的像素,可能首先对图像进行膨胀或腐 eclipse 以补偿扫描伪影。

根据扫描图像的质量,您可能需要使用更高级的技术,但这会让您继续前进。

关于neural-network - 如何制作 OCR 程序?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6549650/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com