gpt4 book ai didi

python - 不同字体大小的文本区域周围的边界框

转载 作者:太空宇宙 更新时间:2023-11-03 14:30:46 24 4
gpt4 key购买 nike

我正在尝试实现某种文本检测算法,我想将图像分成多个区域,每个区域包含不同的字体大小。

如下图所示,例如: example

有没有简单的方法可以使用 python 和/或 opencv 来实现它?如果是这样,怎么办?
我确实尝试过谷歌搜索但找不到任何有用的东西..谢谢。

最佳答案

这是一个有趣的问题。为了实现您的目标,您需要采取一些步骤。我希望您充分了解基本的计算机视觉算法(openCV 函数的知识会有所帮助)以理解我建议的步骤。

  1. 使用形态扩张过程将所有单词分组在一起。
  2. 使用 openCV findcountour 函数来标记所有 Blob 。这还将为您提供每个 Blob 的宽度和高度信息。
  3. 这是棘手的部分,既然您已经有了每个 blob 的数据,请尝试以位置(x,y)和几何(宽度,高度)作为特征对数据运行聚类算法。
  4. 一旦正确地对它们进行聚类,就需要找到最左边、最右边、最顶部和底部的数据来绘制边界矩形。

我希望这能为您提供足够的信息来开始您的工作。它并不详细,但我认为它足以指导您。

关于python - 不同字体大小的文本区域周围的边界框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47329013/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com