gpt4 book ai didi

php - 检测图像中的文本

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:35:27 26 4
gpt4 key购买 nike

关闭。这个问题需要更多focused .它目前不接受答案。












想改善这个问题吗?更新问题,使其仅关注一个问题 editing this post .

5年前关闭。




Improve this question




有什么好的方法可以检测图像是否包含文本?

我不是在寻找一种检索文本的方法,只是为了检测图像中是否存在一个或多个字符。

我可以理解没有万无一失的检测文本的方法,比如字体有点不标准时;可能很难识别。我正在寻求“尽可能好”的解决方案。

请参阅下面图片中的文本示例:
example0
example1
example2
example3
example4

最佳答案

检测是否有文本与提取文本几乎相同,即如果您能够提取文本,则确认存在文本。检测文本大约 90% 的步骤与提取文本的步骤相同,最后 10% 是对 OCR 中特定语言和文本类型的一些优化,以产生更好的文本识别。大多数繁重的工作发生在过程的开始,特别是图像二值化和背景去除、对象分割、布局的文档分析、对象类型检测以及分别识别每个对象。

有关背景信息,请查看我几个月前写的关于通过 OCR 从复杂图片和图像中检测和提取各种文本的博客文章:
http://www.ocr-it.com/user-scenario-process-digital-camera-pictures-and-ocr-to-extract-specific-numbers

对于给定的图像,一个接一个地执行这些步骤,您将能够决定当今的技术是否可以看到这些图像中的文本以及任何其他图片。

  • 二值化。将图像转换为黑白。此转换后,您可以看到打印的文本字符。如果没有 - 进程结束 - 无法检测到文本。如果是,继续下一步。
  • 字符可分离性。人眼比任何技术都具有更强的适应性,甚至可以分辨出隐藏在其他物体中的数据。在二值化图像中,可见字符与任何其他元素分开,即它们不接触其他字符或元素。如果没有 - 过程结束 - 在分析过程中,这些字符很可能不是单个字符,而是一些其他非文本对象(如图片/徽标/图表)的一部分。如果是 - 您可以清楚地看到不同的字符 - 继续下一步。
  • 回转。字符是否在同一“基线”上(您能否在所有字符下方画一条线)?那条线是关于水平还是垂直?如果没有 - 通常是过程结束 - 除非您指示 OCR 软件一个一个地检测单个字符。如果是 - 继续下一步。 (注意:如果有基线,但它处于某个陡峭的角度,就像在“Smoothdealer”图片中一样,诀窍是将图片一次旋转 15 度,然后通过 OCR 传递每个旋转的变体。在某些变体上,文本将接近垂直或接近水平,这是 OCR 可以检测到的。今天的 OCR 系统只能读取水平或垂直(有些可以)旋转的文本)
  • 语。需要指示和预先设置 OCR 以查找某些特定语言,或至少是字符集。您需要指定要查找的可能字符的范围。例如,如果您设置英文字符集,那么一些俄文或中文字母看起来不像字母(从英语语言的角度来看)而是更像图形。

  • 此外,OCR 软件的质量将决定每个步骤的作用有多大。更强大的 OCR 将能够成功处理更复杂的图像。例如,过去使用 Tesseract,它经常返回任何内容,表明图像上没有文本。其他一些商业 OCR 能够从相同的小图片或非常低质量的图片中返回文本,表明存在文本。本质上,两个实体告诉你不同的事情,你需要知道哪一个更聪明,然后听那个。

    此外,某些 OCR 将具有用于“积极”文本提取的特殊模式,甚至可以用于徽标和图形,以便查找和提取每一段文本以及任何看起来像文本的内容。其他 OCR 可能只是将相同的标志视为图片,即使里面有文字,但该文字不会成为字符。想想微软或谷歌的标志。我知道有两种商业产品具有从其他对象中提取高级文本的功能: ABBYY FlexiCapture先进的企业数据采集软件,以及 OCR-IT Cloud OCR API具有TextAgressive分析和提取模式。

    使用上述方法,让我们看看提供的每个示例:

    Donald - 可以检测到某些字符,但几率很小

    Vip House - 无法检测到字符

    Smoothdealer - 可以通过 15 度旋转测试检测字符

    Oneplus - 可以检测字符。大多数 OCR 软件都支持倒排文本。

    500PCS - 可以轻松检测字符

    关于php - 检测图像中的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25280169/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com