gpt4 book ai didi

python - 字符识别的最佳算法

转载 作者:太空宇宙 更新时间:2023-11-03 11:21:50 25 4
gpt4 key购买 nike

我正在尝试从视频创建一个硬编码的字幕开膛手。

到目前为止,我已经做了一些预处理。

  1. 获取字幕框
  2. 裁剪字幕行
  3. 单独的字幕行
  4. 分隔字符。

字符识别的主要部分还没有完成。我尝试使用 tesseract,但准确率约为 60%。我也尝试训练角色图像然后比较它们。但是当我在不同分辨率的视频上运行时,它严重失败。

以下是目前的结果。 (原图、阈值、文字增强、分隔字符)

Original Image

Threshold with 254

Then text enhancement

Separating each character

我确实使用了 K 均值并使用结构相似性比较图像。但在我的情况下没有任何效果。如您所见,图片文字非常清晰。

已编辑:

问题:我想将准确度提高到 95% 或更高,因为所有视频的文本都相似,我能够获得如上所示的明文或字符。我可以尝试哪些最佳方法?

P.S: 语言是克罗地亚语

最佳答案

我会建议两件事:

  1. 多玩一些图片清理
  2. 获得更好的 OCR。 Tesseract 是免费的,但不是最好的。如果你的预算允许,你可以考虑一些商业的。例如:OCRSDK.com这个有一些可用的免费识别,至少足够玩,看看它是否适合你。

我在 demo page 上试过你的最新照片(所有清洁后的照片) ,它几乎完全正确地被识别 - 见下文。比 60% 的错误要好得多。我相信,通过更好的图像预处理,您可以进一步提高准确性。 enter image description here

免责声明:我为 ABBYY 工作。

关于python - 字符识别的最佳算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41318774/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com