gpt4 book ai didi

android - 使用 tesseract 或 OpenCV 进行 android 对象检测

转载 作者:塔克拉玛干 更新时间:2023-11-02 08:26:01 24 4
gpt4 key购买 nike

我已经成功地将 tesseract 集成到我的 android 应用程序中,它可以读取我捕获的任何图像,但准确性非常低。但大多数时候我在捕获后没有得到正确的文本,因为感兴趣区域周围的一些文本也被捕获了。

我只想准确地读取矩形区域中的所有文本,而不捕获矩形的边缘。我已经做了一些研究并在 stackoverflow 上发布了两次,但仍然没有得到满意的结果!

以下是我发表的 2 篇文章:

https://stackoverflow.com/questions/16663504/extract-text-from-a-captured-image?noredirect=1#comment23973954_16663504

Extracting information from captured image in android

我不确定是继续使用 tesseract 还是使用 openCV

最佳答案

包括许多链接和其他人的回答,我认为最好退后一步,注意光学字符识别 (OCR) 实际上有两个基本步骤:

  • 文本检测:这是您的问题的标题和重点,它涉及定位图像中包含文本的区域。
  • 文本识别:这是实际识别发生的地方,其中检测到的局部图像区域逐个字符地进行分割和分类。这也是 Tesseract 等工具发挥作用的地方。

现在,还有两种应用 OCR 的常规设置:

  • 受控:这些是从扫描仪或类似性质的设备中拍摄的图像,其中目标是文档,并且透视、比例、字体、方向、背景一致性等都非常温顺。
  • Uncontrolled/Scene:这些是更自然和野外的照片,例如那些从相机拍摄的,你试图识别街道标志、商店名称等。

Tesseract 原样最适用于“受控”设置。一般而言,但对于场景 OCR,“重新训练”Tesseract 将不会直接改善检测,但可能会改善识别。

如果您希望改进场景文本检测,请参阅此 work ;如果您正在考虑改进场景文本识别,请参阅此 work .由于您询问了检测,检测引用使用最大稳定极值区域 (MSER),它具有过多的实现资源,例如见here .

这里还有一个专门针对 Android 的文本检测项目:
https://github.com/dreamdragon/text-detection

正如许多人指出的那样,请记住,识别仍然是一项开放的研究挑战。

关于android - 使用 tesseract 或 OpenCV 进行 android 对象检测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17237676/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com