python - 如何提取彩色边框内的图像区域？-6ren

python - 如何提取彩色边框内的图像区域？

转载作者：行者123 更新时间：2023-12-05 03:43:26

25

4

我正在尝试根据图像上彩色框的边框提取图像的分段区域(见下文)。

I want to extract the area of the image within the yellow box. .

作为引用，我使用 pdfplumber 从 PDF 中提取此图像的 im.draw_rect 函数，它需要 ImageMagick 和 Ghostscript。我到处寻找解决这个问题的方法，而 Mark Setchell 对问题 Python: How to cut out an area with specific color from image (OpenCV, Numpy) 的回答已经接近，我遇到了一些意外错误。

到目前为止，这是我尝试过的:

import numpy as np
from PIL import Image, ImageFilter
impath = r'Path\to\drawn_p9_image.png'
im = Image.open(impath).convert('RGB')
na = np.array(im)
orig= na.copy()
im = im.filter(ImageFilter.MedianFilter(3))
yellowY, yellowX = np.where(np.all(na==[247,213,83],axis=2))
top, bottom = yellowY[0], yellowY[-1]

但是当我运行最后一行时，出现了这个错误:

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
IndexError: index 0 is out of bounds for axis 0 with size 0

所以 NumPy 数组实际上并没有捕获它应该捕获的数据。当我检查 NumPy 数组时，这是它的输出:

>>> na
array([[[255, 255, 255],
        [255, 255, 255],
        [255, 255, 255],
        ...,
        [255, 255, 255],
        [255, 255, 255],
        [255, 255, 255]],

       [[255, 255, 255],
        [255, 255, 255],
        [255, 255, 255],
        ...,
        [255, 255, 255],
        [255, 255, 255],
        [255, 255, 255]],

       [[255, 255, 255],
        [255, 255, 255],
        [255, 255, 255],
        ...,
        [255, 255, 255],
        [255, 255, 255],
        [255, 255, 255]],

       ...,

       [[255, 255, 255],
        [255, 255, 255],
        [255, 255, 255],
        ...,
        [255, 255, 255],
        [255, 255, 255],
        [255, 255, 255]],

       [[255, 255, 255],
        [255, 255, 255],
        [255, 255, 255],
        ...,
        [255, 255, 255],
        [255, 255, 255],
        [255, 255, 255]],

       [[255, 255, 255],
        [255, 255, 255],
        [255, 255, 255],
        ...,
        [255, 255, 255],
        [255, 255, 255],
        [255, 255, 255]]], dtype=uint8)

我不确定为什么这种方法不起作用，并且正在寻找有关如何修复它的一些指导。我同意在最终裁剪后的图像中看到黄色边界，如果这提供了更简单的解决方案的话。

最佳答案

正如 Mark 已经在评论中指出的那样，黄色矩形没有 [247, 213, 83] 的 RGB 值。 ImageJ ，例如，返回纯黄色 [255, 255, 0]。因此，使用此值可能已经有所帮助。

尽管如此，为了克服关于最终 RGB 值的不确定性，可能还因平台、软件等而异，我建议使用 HSV color space 来使用颜色阈值。，它也可以使用 Pillow，cf。 modes .

您只需要注意适当的值范围:例如，色调 channel 的值在 [0 ... 360](度)范围内，映射到一个完整的 8 位无符号整数，即 [0 ... 255] 的范围。同样，饱和度和值从 [0 ... 100](百分比)映射到 [0 ... 255]。

剩下的就是找到合适的色相、饱和度和明度范围(例如使用一些 HSV color picker )，以及 NumPy 的 boolean array indexing掩盖给定图像中的黄色区域。

对于最后的裁剪，您可以添加一些额外的边框来去除黄色边框本身。

最后，这是一些代码:

import numpy as np
from PIL import Image


# Convert degree range (0 - 360) to uint8 value range (0 - 255)
def deg_to_uint8(deg):
    return deg / 360 * 255


# Convert percentage range (0 - 100) to uint8 value range (0 - 255)
def perc_to_uint8(perc):
    return perc / 100 * 255


# Open image, and convert to HSV color space for NumPy slicing
img = Image.open('MDRBG.png')
hsv = np.array(img.convert('HSV'))

# Masking color-ish area via NumPy slicing using upper and/or lower
# bounds for hue, saturation, and value
box = hsv[..., 0] > deg_to_uint8(55)        # Hue > 55°
box &= hsv[..., 0] < deg_to_uint8(65)       # Hue < 65°
box &= hsv[..., 1] > perc_to_uint8(80)      # Saturation > 80%
box &= hsv[..., 2] > perc_to_uint8(80)      # Value > 80%

# Find x, y coordinates of masked area; extract first and last elements
xy = np.argwhere(box)
t, b = xy[[0, -1], 0]
l, r = xy[[0, -1], 1]

# For better cropping, maybe add some additional border
bl, bt, br, bb = (3, 3, 3, 3)

# Actual cropping of the image
crop = img.crop((l + bl, t + bt, r - br, b - bb))
crop.save('crop.png')

这就是输出:

----------------------------------------
System information
----------------------------------------
Platform:      Windows-10-10.0.16299-SP0
Python:        3.9.1
NumPy:         1.20.2
Pillow:        8.1.2
----------------------------------------

关于python - 如何提取彩色边框内的图像区域？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/66846065/

25

4

0

文章推荐： python - 将 datetime.datetime 对象写入文件

文章推荐： macos - dnsmasq - Apple Silicon M1 上的服务状态问题

文章推荐： docker - Kubernetes 无法在 WSL2 镜像中挂载卷

winapi - 我应该如何处理 Direct2D 应用程序中的更新矩形/区域/区域？
在使用 GDI 进行图形处理的传统 Windows 程序中，您必须担心只绘制需要重绘的窗口区域；这是“更新矩形”，可以通过 PAINTSTRUCT.rcPaint 或通过调用 GetUpdateRec
TFS 混淆了团队、区域、项目、区域、迭代
我对 TFS 中的所有内容感到困惑。有人可以解释一下所有这些是如何组合在一起的吗？团队项目合集团队项目团队地区迭代来自 this page,我认为一个(团队)项目集合可以包含多个(团队)项
amazon-web-services - 区域/边缘优化 API 网关 VS 区域/边缘优化自定义域名
这对我来说根本没有意义。创建新的 API 网关时，您可以指定它是区域优化的还是边缘优化的。但话又说回来，当您为 API Gateway 创建自定义域名时，您可以在两者之间进行选择。最糟糕的是，您可以
vba - 循环遍历工作表中的区域/区域？
我有一个工作表，其中包含我想循环遍历的许多不同区域。我将进行一些计算，并认为它比在列中逐个单元格地更快/更有效。我尝试了一些不同的东西，但不知道如何跳到下一个区域。我已经发表了一些评论，最有希望的是
TFS 区域、优化定义和配置
最近迁移到 TFS 2010 后，我想知道对于区域而言，最佳或最广泛接受的定义或配置是什么？我能在网上找到的唯一有用的文章是 this one并且是我认为是正确的。然而，这让我开始思考是否以下任何一
Azure 生命周期管理 - 区域
我在“北欧”有一个存储帐户，现在我想使用生命周期管理将冷 blob 移动到存档层。但是我每次尝试都会遇到以下失败:无法为存储帐户“myStorageAccount”添加生命周期管理规则。错误:管理策
java 项目 - 区域
我正在开发一个项目，您在扫描仪中输入州的缩写，然后程序会告诉您该州位于美国的哪个地区。我认为我的大部分代码都是正确的，但我有以前从未使用过 switch。我已经将我的工作改进为一个错误，即我的第一个
AngularJS View /区域
我正在尝试学习 AngularJS，我想我有一个架构问题。如果我想开始开发一个应用程序，比方说，比如 youtube，我如何在“区域”(比如 Marionette)中组织页面？我的意思是:顶部导航栏
检查指针是否位于 malloc 区域？
我正在制作一个动态内存分配器，当我释放其中的一部分时，我需要检查我传递给函数的指针实际上是否在该区域内。我有一个指向 malloc 区域开头的指针 typedef unsigned char byte
javascript - 突出显示<区域>
有时我想看看到底在哪里页面上图片上的标签。在 Javascript 中有没有办法改变颜色或隐藏与区域标签对应的图像部分？最佳答案也许您正在寻找类似 mapper.js 的内容.它允许您在鼠标
javascript - 如何向图表添加高亮标记/区域？
我有一个使用 D3 js 创建的时间序列图表。我想为特定时间间隔添加高亮区域，以显示在该特定时间发生的特定事件(会有不同类型的事件，因此每个高亮标记将根据其类型具有不同的颜色)。我希望这个突出显示区域
php - 无法使用密码保护页面/区域
我正在尝试创建网站的密码保护区。我想通过检查 MySql 表中的用户名和密码来允许访问，然后启动一个 session 并允许在 session 处于事件状态时访问多个页面。如果有人尝试直接访问这些页面
ios - ScrollView 区域
在 ScrollView 中我添加了几个按钮。正如您在图片中看到的，2 个按钮完全可见，第三个按钮半可见。当我向右滚动看到第三个时；1-如果滚动条很短，则它会滚动回到第一个位置。2- 如果滚动足够则显
ios - 叠加场景/区域
我正在开发我的第一个 spritekit 应用程序，并且有一个关于如何处理我想到的事情的快速问题。我正在制作一个我想要的棋盘游戏原型(prototype)，并希望在 iOS map 中进行一些集思广益
c# - 区域 - 日期和时间问题
在我的 C# 程序中，我收到这样的日期和时间:DateTime.Now 我得到:19/09/2010 20:10:30 因为我的地区是:希伯来语(以色列) 但是如果我将我的程序安装在区域为 Engli
c# - 区域/结束区域预处理器
有时我在 Visual Studio 的源文件中运行(在我的例子中是 2010)，我看到很多区域，我必须点击 + 号才能一个一个地打开它们! 是否有任何快捷方式或菜单选项可以使这对我来说更容易，并且对
android - 试用期间存储文件的最佳位置/区域
关闭。这个问题是opinion-based .它目前不接受答案。想要改进这个问题？更新问题，以便 editing this post 可以用事实和引用来回答它. 关闭 7 年前。 Improve
algorithm - 在二维数据中查找峰值(区域)
我正在寻找二维数据中的峰值区域(如果您愿意，灰度图像或二维景观，通过霍夫变换创建)。峰值区域是指局部最大峰值，但不是单个点而是周围的一部分strong>contributing region 随之而
Java - 将字符或字符串转换为形状/区域
我希望能够将任何字符或字符串转换为形状或区域，以便我可以按照我喜欢的任何大小、样式、效果等来绘制该字符。更具体地说，我将使用视差绘制它，以便它仅在特定角度清晰定义(这就是为什么我不能使用 html
java - 仅渲染与主圆相交的圆的段/区域
我非常喜欢数学(或者你们大多数人会说的“数学”!)，但我还没有达到知道这个问题答案的程度。我有一个主圆，它可以在显示器上的任何 x 和 y 处有一个中心点。其他圆圈将随意在显示器周围移动，但在任何给定

首页

博学

6Ren·AI

商城

python - 如何提取彩色边框内的图像区域？