gpt4 book ai didi

c++ - 取一个图像的一部分来创建另一个图像

转载 作者:塔克拉玛干 更新时间:2023-11-03 07:57:43 25 4
gpt4 key购买 nike

我正在处理图像,我想从中取出部分并制作一张新图像。我可以使用 ImageMagick 或 OpenCV。这是一个示例图片:

enter image description here

我想从这张图片中取出标题、两个带注释的文本(一个在圆圈中、一个在矩形中)和底部的文本。

因此,最终图像将具有:图像标题、注释文本 1、注释文本和这是一些测试。图像的这些部分在新图像中不必按任何特定顺序排列。

问题

  • 我可以使用什么样的策略来做到这一点?
  • hough 或 canny 会有帮助吗?
  • 我在想,既然我想要返回的图像部分都是文本,也许 hough line 可以检测到直线,然后我裁剪掉图像的那些部分...
  • 我的主要目标是提取文本,以便将其发送到 OCR

我试图腐 eclipse 图像并想出了这个:

enter image description here

我的策略

以下是我的策略,只保留部分图像的白色背景和文本。但是,我不确定这是否适用于 OpenCV...

图像中会有不同的ROI

  • 图片上方总是有白色背景,我们称这个空间为标题。所以我裁剪掉图像顶部的矩形部分并将其另存为单独的图像
  • 图像底部总是有白色背景,我们称其为正文。所以我把图片底部的矩形部分裁剪掉,另存为单独的图片
  • 图像上方会有一些文字,我们称其为带注释的文字。这将是正方形或圆形。我可以使用 this answer 中提到的技术裁剪图像的这些部分并将它们另存为单独的图像。

最佳答案

如果您只处理外观相似的字体,而不是寻找 super 高效的东西,您可以简单地对字母表中的每个字母(26 个大写字母和 26 个小写字母)执行关联。阈值峰值并将它们加在一起。然后,您可以只定义峰周围的边界框。

关于c++ - 取一个图像的一部分来创建另一个图像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15736565/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com