imagemagick - 我可以使用 ImageMagick 获取单个字符的边界框吗？-6ren

imagemagick - 我可以使用 ImageMagick 获取单个字符的边界框吗？

转载作者：行者123 更新时间：2023-12-05 06:25:00

27

4

我遇到了一个 paper它使用由 ImageMagick convert 命令生成的合成手写数据，使用许多不同的手写字体 ( Example images from paper )。

他们已经用他们的转录注释了这些图像，但我想用每个单独字符的边界框来注释它们。我想知道这是否可以通过 ImageMagick 或任何其他可用的工具/脚本/代码实现。

最佳答案

我已经解决了这个问题，方法是使用 ImageMagick 一次一个地迭代生成新字符，并使用 OpenCV 屏蔽掉之前的字符以获得新字符的边界框 ( Example result)。

示例代码:

import subprocess
import numpy as np
import cv2

full_text = 'OpenCV'
fname = 'test.jpg'
im_size = 'x75'
font = '"ambarella/Ambarella.ttf"'
other_options = '-gravity West -stroke black'

bboxes = []
prev_img = None

# For each letter
for i in range(len(full_text)):
    text = '"' + full_text[:i + 1] + '"'
    fname = 'test_out/' + str(i) + '.jpg'
    command = 'convert -size ' + im_size + ' -font ' + font + ' ' + other_options + ' label:' + text + ' ' + fname
    subprocess.run([command], shell=True)
    img = cv2.imread(fname, 0)
    # Threshold the image
    ret, img = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
    if prev_img is None:
        inv = 255 - img
        nonzero = cv2.findNonZero(inv)
        x1, y1, w, h = cv2.boundingRect(nonzero)
        x2 = x1 + w
        y2 = y1 + h
        prev_img = img.copy()
        bboxes.append((x1, y1, x2, y2))
    else:

        h, w = img.shape
        d_h, d_w = h - prev_img.shape[0], w - prev_img.shape[1]
        # Pad the older image
        if d_w > 0:
            prev_img = cv2.copyMakeBorder(prev_img, d_h, 0, 0, d_w, cv2.BORDER_CONSTANT, value=255)

        # Mask the previous letters
        nonzero_prev = (prev_img == 0)
        masked_out = img.copy()
        masked_out[nonzero_prev] = 255

        # Get bounding box of new letter
        inv = 255 - masked_out
        nonzero = cv2.findNonZero(inv)
        x1, y1, w, h = cv2.boundingRect(nonzero)
        x2 = x1 + w
        y2 = y1 + h
        bboxes.append((x1, y1, x2, y2))
        # Set prev image to current image
        prev_img = img.copy()

# Visualize results
colors = ((255, 0, 0), (0, 255, 0), (0, 0, 255))
img = cv2.imread(fname)
for i, b in enumerate(bboxes):
    x1, y1, x2, y2 = b
    cv2.rectangle(img, (x1, y1), (x2, y2), colors[i % len(colors)], 1)

cv2.imwrite('boxes.png', img)

关于imagemagick - 我可以使用 ImageMagick 获取单个字符的边界框吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57389967/

27

4

0

文章推荐： git - 如何在 merge 时更新 setup.py 版本

文章推荐： python - 通过宽数据格式的多列循环python auto_arima

文章推荐： angular - 如何在 Angular 6 中过滤 FormArray 元素

iphone - 边界] 横向时不改变
我编写了一个应用程序，它有一个 UIViewController，它在纵向模式下显示另一个 UIViewController，在横向模式下显示不同的 UIViewController。当我去风景时，
iphone - UISegmentedControl 边界
我想为 UISegmentedControl 提供以下方面: 注意灰色背景 View ，以及分段控件未选定项目的白色背景。但是，如果我为 UISegmentedControl 提供白色背景，我会得到
javascript - 可排序的容器/边界
我正在尝试为我的可排序项目创建边界。我看过这个问题/答案: jquery sortable keep within container Boundary 并尝试将我的 JS 以此为基础，但无论出于何种
Java JFrame 边界
我正在尝试编写执行以下操作的代码:如果我单击起始位置为 (100,100) 的字符串 C(JLabel)，该字符串将在 JFrame 的边界内移动。代码本身并不难实现，但我遇到了问题为 JLabel
应用约束后快速获取 View 边界
我有一个 .xib 文件，其中包含我想用来播放视频文件的 View 。该 View 具有配置其大小和位置的约束。现在我需要获取这些来配置我的视频播放器: let slide1: OnboardingS
swift - MKMapView 边界
我将从 Google map 转到 Apple map 。 Google map 能够根据东北和西南坐标更新相机，如下所示: let bounds = GMSCameraUpdate.fit(GMSC
Android 为我的图片添加圆角线？边界
这个问题在这里已经有了答案: Border over a bitmap with rounded corners in Android (6 个答案) 关闭 6 年前。如何为我的图片添加圆角边框？
Java AWT 边界
我有一个任务是使用java.awt.Graphics绘制一定数量的圆圈。绘制圆圈相当简单，但我只应该在圆圈出现在可见区域内时绘制圆圈。我知道我可以调用方法 getClipBounds() 来确定绘图
html - 过渡方向 - 边界
我在设置过渡时遇到问题，目前它是从上到下(它是悬停时显示的边框)。我希望过渡从中间开始并传播到侧面，或者至少从任何一侧开始并传播到另一侧... 我的导航菜单 anchor 使用导航链接类! * {
C++: vector 边界
我来自 Java，目前正在学习 C++。我正在使用 Stroustrup 的 Progamming Principles and Practice of Using C++。我现在正在使用 vecto
C++循环展开，边界
我有一个要展开的循环: for(int i = 0; i < N; i++) do_stuff_for(i); 展开: for(int i = 0; i < N; i += CHUNK) {
与子类型一起使用的 Scala View 边界？
Scala 中是否有类似 View 绑定(bind)但可以匹配子类型的东西？由于 Scala 中的 View 没有链接，我目前有以下内容: implicit def pimpIterable[A,
javascript - map 边界!如何检查地址是否位于边界内？
网站用户输入地址。如果地址在边界内，则“合格”。如果地址超出边界，则“不合格”。是否有现有的小部件或代码可以执行此操作？有人知道实现这一目标的第一步吗？感谢您的任何意见。最佳答案哇，反对票是怎
haskell - 加密和 ByteString 边界
我有以下测试应用程序: import Codec.Crypto.AES import qualified Data.ByteString.Char8 as B key = B.pack "Thisis
java - JFrame - 设置位置/边界？
我正在尝试添加一个 JButton，但它与进度条水平对齐。如何将 JButton 对齐到下面的线上？另外，我试图将所有组件分组到不同的组中，但我不确定如何执行此操作。有谁知道吗？最佳答案要简单分
python - 查找相框的 Canvas 边界
假设我们有一个像上面这样的相框。从中心开始，如何找到可用于绘制的面积最大的矩形(矩形中的所有像素必须为 rgb(255,255,255)？我需要找到图中所示的A点和B点的x和y坐标。我的方法之一是
c# - 类(class)边界
这可能是一个愚蠢的问题，但当我创建一个类时，我应该如何正确设置其中属性的边界。例子:如果我有这门课 class Product { private string name; publ
javascript - 如何获得 map 边界？
我正在从 leaflet 迁移回来，如果我需要 map 绑定(bind)，我使用以下代码: var b = map.getBounds(); $scope.filtromapa.lat1 = b.ge
ios - UIView 边界/框架与绘制矩形不匹配
我正在学习如何创建自定义 UIView。我正在制作的这个特定 View 包含几个按钮。我注意到，当我从惰性实例化 block 中调用frame/height属性时，我得到的值是128，但是当我调用dr
java - 反转 JFrame 边界
我正在尝试制作一个弹跳球。设置的边界允许球在超出框架边界后从起点开始。我无法让球弹起来。一旦击中边界(框架的外边缘)，如何让球弹起？我相信问题出在 moveBall() 方法中。主类导入 java

首页

博学

6Ren·AI

商城

imagemagick - 我可以使用 ImageMagick 获取单个字符的边界框吗？