gpt4 book ai didi

linux - linux命令行获取灰度图 "text"边界框坐标

转载 作者:IT王子 更新时间:2023-10-29 00:39:34 24 4
gpt4 key购买 nike

正如标题所说。

严格来说,我定义为灰度图像的“文本”边界框是一组 4 个坐标 (x,y,x+width,y+height),它们必须在该图像中定义一个矩形区域,该区域具有最大数量的非白色像素,同时尽可能少的白色像素数量(不改变非白色像素的最大数量)。我在引号中有文字,因为图像实际上并不包含文字,因为图像只包含带颜色的像素。

在我的 Ubuntu 中安装了 ImageMagick 并在终端中输入命令:$convert input.png -trim ouput.png,我得到:

input.png

output.png

在网络浏览器的新选项卡中打开这两张图片,您将了解它们之间的区别,您还将了解我定义为“文本”边界框的内容。output.png 实际上有我正在寻找的宽度和高度。我不知道如何获得 x 和 y 坐标。

此处提供的答案 (1)对于 pdf 页面不符合我的标准,因为 gs 给我的“文本”边界框有很大的白边(实际上据我所知,gs 定义为 pdf 的“文本”边界框与我的定义不同图片的“文本”边界框)。

最佳答案

我不理解你描述中的所有单词,我认为图表会有所帮助,但如果你只是想知道 -trim 会像你的示例代码所暗示的那样做什么:

identify -format "%@" image.png
200x100+10+20

所以,对于你的形象,你得到

identify -format "%@" paper.png
406x620+38+68

这意味着您的框位于左上角右侧 38 像素和左上角下方 68 像素处,宽 406 像素,高 620 像素。

如果我用红色绘制那个矩形,我会得到:

convert paper.png -stroke red -fill none -draw "rectangle 38,68 444,688" result.png

enter image description here

获得相同结果但使用 convert 代替 identify 的另一种方法是:

convert -format %@ paper.png info:
406x620+38+68

关于linux - linux命令行获取灰度图 "text"边界框坐标,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32805451/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com