gpt4 book ai didi

python - 验证码识别最佳实践

转载 作者:行者123 更新时间:2023-12-02 17:45:17 26 4
gpt4 key购买 nike

我正在从事一个基于文本的验证码识别的真实项目。

图像处理步骤大致设计为

  • 预处理灰度图像(膨胀,腐 eclipse 或模糊等),以消除微小的噪声。
  • 裁剪,如果内容
  • 周围有边框填充
  • 根据水平轴计算直方图,并尝试垂直破解文本。
  • 使用tesseract之类的工具识别单个字符。

  • 目前,我正在使用Python + Opencv进行编码,结果如下:

    captcha processing

    因此,我现在有了直方图。如果我在数字中填充一些孔,则每个文本都将很好地显示为直方图中的正态分布。

    但是我如何才能真正找出这张图中的每个局部最大值?当前,直方图是离散的而不是那么平滑。我现在停留在这个阶段。

    而且,这些噪声条也无法去除。因为文本使用不同的颜色。那么我需要将色彩空间转换为HSV还是其他?

    如果您能给我一些建议,我将不胜感激。

    谢谢!

    最佳答案

    是的。尝试调查HSV各个层中的图像外观。将直方图均衡/对比度归一化应用于值层,阈值,并查看是否存在差异。

    关于python - 验证码识别最佳实践,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37160380/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com