gpt4 book ai didi

opencv - OCR:小文本分割

转载 作者:太空宇宙 更新时间:2023-11-03 20:45:49 26 4
gpt4 key购买 nike

问题

我一直在构建一个(非常)简单的 OCR 引擎。由于我正在尝试对非常小(像素大小)的字符进行分类,因此我在分割方面遇到了一些困难。这是一个示例,在尽力而为的图像范围阈值处理之后:

image of problematic segmentation on 63 :

我尝试过的

错误检测:

  • 段的水平尺寸较大。它主要有效,但失败(误报)对于一些较大的字符。
  • 分类,并在低分时拒绝。这似乎有点浪费。

错误更正:

  • 垂直添加像素(垂直直方图),找到最小值。在许多样本中,它在错误的地方切割了很多片段。

我还没有尝试过的

  • 尝试对所有可能的分割点(像素)进行分类。这将非常浪费,并且难以扩展为 3 个合并字符的段。
  • 我一直在阅读 morphology approaches将字符变成数学曲线,但我真的不知道从哪里开始,或者是否值得努力

从这里去哪里?

我不知道。因此这个问题:)

最佳答案

body 向后靠,半闭上眼睛。

63:-)

现在,要是计算机能这么简单就好了!

它非常接近双图案在硅掩模中的作用(或未作用?)。

我会建议过采样(每个轴上的像素数加倍或四倍)、过滤(可能是低通 - 或者可能是带通,其中通带 = 一条线的空间频率)、重新设定阈值直到它们分开。价格昂贵,所以只适用于有问题的地方。

关于opencv - OCR:小文本分割,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14000092/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com