python - python中使用openCV进行多线程图像处理-6ren

python - python中使用openCV进行多线程图像处理

转载作者：行者123 更新时间：2023-11-30 21:53:48

我对 python 很陌生，并且在并行化我的算法的一部分时遇到问题。考虑需要在像素级别以某种方式设置阈值的输入图像。由于该算法仅考虑特定区域来计算阈值，因此我想在单独的线程/进程中运行图像的每个 block 。这就是我被困住的地方。我找不到这些线程在同一图像上工作的方法，也找不到如何将结果合并到新图像中。因为我通常来自java世界，所以我通常会解决我不想干扰其他线程的问题。因此我只是尝试将图像传递给每个进程。

def thresholding(img):
    stepSize = int(img.shape[0] / 10)
    futures = []
    with ProcessPoolExecutor(max_workers=4) as e:
        for y in range(0, img.shape[0], stepSize):
            for x in range(0, img.shape[1], stepSize):
                futures.append(e.submit(thresholdThread, y, x, img))
    concurrent.futures.wait(futures)
    return img


def thresholdThread(y, x, img):
    window_size = int(img.shape[0] / 10)
    window_shape = (window_size, window_size)
    window = img[y:y + window_shape[1], x:x + window_shape[0]]
    upper_bound, lower_bound, avg = getThresholdBounds(window, 0.6)

    for y_2 in range(0, window.shape[0]):
        for x_2 in range(0, window.shape[1]):
            tmp = img[y + y_2, x + x_2]
            img[y + y_2, x + x_2] = tmp if (tmp >= upper_bound or tmp <= lower_bound) else avg
    return str(avg)

据我了解Python，这是行不通的，因为每个进程都有自己的img副本。但由于 img 是来自 numpy 的 ndarray float 类型，我不知道是否以及如何使用描述的共享对象 here .

仅供引用:我正在使用 python 3.6.9。我确实知道 3.7 已经发布了，但是重新安装所有东西以便我可以使用spyder 和 openCV 并不那么容易。

最佳答案

您没有利用任何 Numpy 的矢量化技术，这可以显着减少处理时间。我假设这就是您想要在图像的窗口/ block 上进行多进程操作的原因 - 我不知道 Docker 是什么，所以我不知道这是否是您的多进程方法中的一个因素。

这是一个矢量化解决方案，但需要注意的是它可能会从操作中排除底部和右边缘像素。如果这是 Not Acceptable ，则无需继续阅读。

您的示例中的右边缘和下边缘窗口的大小很可能与其他窗口不同。看起来您任意选择了十倍来分割图像 - 如果十是任意选择，您可以轻松优化底部和右边缘增量 - 我将在答案末尾发布该函数。

图像需要被 reshape 成补丁以矢量化操作。我用过 sklearn function sklearn.feature_extraction.image._extract_patches因为它很方便并且允许创建不重叠的补丁(这似乎就是您想要的)。注意下划线前缀 - 这曾经是一个暴露函数，image.extract_patches ，但这已被弃用。该函数使用 numpy.lib.stride_tricks.as_strided - 可能只是reshape数组，但我还没有尝试过。

设置

import numpy as np
from sklearn.feature_extraction import image
img = np.arange(4864*3546*3).reshape(4864,3546,3)
# all shape dimensions in the following example derived from img's shape

定义补丁大小(请参阅下面的 opt_size)并 reshape 图像。

hsize, h_remainder, h_windows = opt_size(img.shape[0])
wsize, w_remainder, w_windows = opt_size(img.shape[1])

# rgb - not designed for rgba
if img.ndim == 3:
    patch_shape = (hsize,wsize,img.shape[-1])
else:
    patch_shape = (hsize,wsize)

patches = image._extract_patches(img,patch_shape=patch_shape,
                                 extraction_step=patch_shape)
patches = patches.squeeze()

patches是原始数组的 View ，对它的更改将在原始数组中看到。它的形状是(8, 9, 608, 394, 3)有8x9 , (608,394,3)窗口/补丁。

找到每个补丁的上限和下限；将每个像素与其补丁的边界进行比较；提取其边界之间且需要更改的每个像素的索引。

lower = patches.min((2,3)) * .6
lower = lower[...,None,None,:]
upper = patches.max((2,3)) * .6
upper = upper[...,None,None,:]
indices = np.logical_and(patches > lower, patches < upper).nonzero()

找到每个补丁的平均值，然后更改所需的像素值，

avg = patches.mean((2,3))    # shape (8,9,3)
patches[indices] = avg[indices[0],indices[1],indices[-1]]

<小时/>

将所有内容组合在一起的函数

def g(img, opt_shape=False):
    original_shape = img.shape

    # determine patch shape   
    if opt_shape:
        hsize, h_remainder, h_windows = opt_size(img.shape[0])
        wsize, w_remainder, w_windows = opt_size(img.shape[1])
    else:
        patch_size = img.shape[0] // 10
        hsize, wsize = patch_size,patch_size

    # constraint checking here(?) for
    #     number of windows,
    #     orphaned pixels

    if img.ndim == 3:
        patch_shape = (hsize,wsize,img.shape[-1])
    else:
        patch_shape = (hsize,wsize)

    patches = image._extract_patches(img,patch_shape=patch_shape,
                                     extraction_step=patch_shape)
    #squeeze??
    patches = patches.squeeze()

    #assume color (h,w,3)
    lower = patches.min((2,3)) * .6
    lower = lower[...,None,None,:]
    upper = patches.max((2,3)) * .6
    upper = upper[...,None,None,:]
    indices = np.logical_and(patches > lower, patches < upper).nonzero()

    avg = patches.mean((2,3))
##    del lower, upper, mask
    patches[indices] = avg[indices[0],indices[1],indices[-1]]

<小时/>

def opt_size(size):
    '''Maximize number of windows, minimize loss at the edge

    size -> int
       Number of "windows" constrained to 4-10
       Returns (int,int,int)
           size in pixels,
           loss in pixels,
           number of windows
    '''

    size = [(divmod(size,n),n) for n in range(4,11)]
    n_windows = 0
    remainder = 99
    patch_size = 0
    for ((p,r),n) in size:
        if r <= remainder and n > n_windows:
            remainder = r
            n_windows = n
            patch_size = p
    return patch_size, remainder, n_windows

<小时/>

针对您的天真流程进行了测试 - 我希望我正确执行了它。 4864x3546 彩色图像大约提高了 35 倍。可能还有进一步的优化，也许一些向导会评论。

使用 block 因子 10 进行测试:

#yours
def f(img):
    window_size = int(img.shape[0] / 10)
    window_shape = (window_size, window_size)

    for y in range(0, img.shape[0], window_size):
        for x in range(0, img.shape[1], window_size):

            window = img[y:y + window_shape[1], x:x + window_shape[0]]
            upper_bound = window.max((0,1)) * .6
            lower_bound = window.min((0,1)) * .6
            avg = window.mean((0,1))

            for y_2 in range(0, window.shape[0]):
                for x_2 in range(0, window.shape[1]):
                    tmp = img[y + y_2, x + x_2]
                    indices = np.logical_and(tmp < upper_bound,tmp > lower_bound)
                    tmp[indices] = avg[indices]


img0 = np.arange(4864*3546*3).reshape(4864,3546,3)
#get everything the same shape
size = img0.shape[0] // 10
h,w = size*10, size * (img0.shape[1]//size)
img1 = img0[:h,:w].copy()
img2 = img1.copy()

assert np.all(np.logical_and(img1==img2,img2==img0[:h,:w]))
f(img1)    # ~44 seconds
g(img2)    # ~1.2 seconds
assert(np.all(img1==img2))
if not np.all(img2==img0[:h,:w]):
    pass
else:
    raise Exception('did not change')

<小时/>

indices是 index array 。它是一个数组元组，每个维度一个数组。 indices[0][0],indices[1][0],indices[2][0]将是 3d 数组中一个元素的索引。完整的元组可用于索引数组的多个元素。

>>> indices
(array([1, 0, 2]), array([1, 0, 0]), array([1, 1, 1]))
>>> list(zip(*indices))
[(1, 1, 1), (0, 0, 1), (2, 0, 1)]
>>> arr = np.arange(27).reshape(3,3,3)
>>> arr[1,1,1], arr[0,0,1],arr[2,0,2]
(13, 1, 20)
>>> arr[indices]
array([13,  1, 19])

# arr[indices] <-> np.array([arr[1,1,1],arr[0,0,1],arr[2,0,1]])

np.logical_and(patches > lower, patches < upper)返回一个 bool 数组和 nonzero() 返回值为 True 的所有元素的索引.

关于python - python中使用openCV进行多线程图像处理，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59520545/

文章推荐： c# - 在 Nsight 或 Visual Profiler 中分析 managedCuda

文章推荐： python - 除非按顺序，否则不会读取路径

文章推荐： C# 检查 JSON 响应是否包含 key

文章推荐： c# - PostAsync 后未收到响应

[图像处理]基于CleanVision库清洗图像数据集
CleanVision是一个开源的Python库，旨在帮助用户自动检测图像数据集中可能影响机器学习项目的常见问题。该库被设计为计算机视觉项目的初步工具，以便在应用机器学习之前发现并解决数据集中的问题。
java - 图像处理
我只是想知道需要什么样的计算/编程语言/框架来生成图像，例如 http://www.erdas.com/ 中的图像。 ? 以编程方式，如何生成一般空间分析图像？ ps:我大部分时间都在使用java。
Grails 图像处理
我尝试在我的 grails 项目(Mac OS X 上的 1.1.1)中使用一些图像处理插件或 java 库:imageTools 插件、imageJ、awt 库等。每次我从路径打开/获取图像以启动进
Java 图像处理
我有一个项目，我必须以多种方式处理图像。我陷入了像素化的困境。对于像素化，我必须采用一组 10x10 像素并返回一个单独平均 RGB 颜色的单元格。目前我在运行程序中得到的只是一个红色图像。谢谢您的
java - 图像处理
就目前情况而言，这个问题不太适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、民意调查或扩展讨论。如果您觉得这个问题可以改进并可能重新开放，visit
python - 图像处理
这是一项作业，因为我是Python编程新手，所以我付出了很大的努力: 我正在运行以下函数，它接受图像和短语(空格将被删除，因此只有文本)作为参数，我已经获得了所有导入和预处理代码，我只需要实现这个函数
c++ - 图像处理
关闭。这个问题需要更多focused .它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 8 年前。 Improve this qu
c# - 图像处理
我需要一种简单易学且快速的方法来从背景图像、文本生成图像，然后保存为 JPEG 格式。您有什么建议？有关于此的任何图书馆或教程吗？重要的标准是简单。最佳答案在 .Net 3.5/4 中，您还可以
iphone, 图像处理
我正在构建一个夜视应用程序，但我没有找到任何有用的算法可以应用于黑暗图像以使其清晰。任何人请给我一些好的算法。提前致谢最佳答案由于 iphone 镜头和传感器的尺寸，无论您做什么，都会有很多噪音
C++ 图像处理
所以我为游戏制作了这个程序，需要帮助让它更自动化一些。程序接收图像然后显示它。我正在对 OpenGL 中的纹理执行此操作。当我截取游戏截图时，它通常约为 700x400。我将高度和宽度输入到我的程序
java - 图像处理
我想更改图像中像素的值，为此我需要将图像存储为矩阵。我怎样才能完成这项工作？请指导。最佳答案 BufferedImage image = ImageIO.read(..); image.setRGB
php - 用图像替换帧中检测到的对象。(图像处理)
概述: 我正在做一个视频创作项目。我使用的技术有:imageMagick、php、ffmpeg。当前状态: 目前，该项目能够使用图像和文本以及很少的基本过渡来创建视频。我这样做的方式是使用 imag
php - 图像处理 PHP
我正在创建 facebook 应用程序，其中我将用户图像作为背景图像，并有一个用户可以四处移动的默认大写图像。用户将叠加图像(一顶帽子)放在正确的位置后，他点击保存这就是我感到震惊的地方，我想知道如
javascript - 图像处理/JavaScript
我正在尝试编写一个 JavaScript 程序，通过在图像上放置三个垂直条纹来修改图像。左边三分之一是红色条纹，中间是绿色条纹，右边三分之一是蓝色条纹。这是我试图实现的算法:1. 从您要更改的图像开
image - [图像处理]阈值不能忽略透明像素
目前，我正在尝试通过图像分割方法将面部和头发修剪在一起，然后将所有非彩色像素设置为透明，然后尝试使用Binary Threshold技术和Adaptive Threshold。但是我得到了不希望的结果
android - 图像处理:在打开的书中查找突出的页面并进行透视变换
我必须使此图像Book Image To Process的页面标题为:“单元3:主动学习的秘诀”，使其成为图像中的唯一页面为此，我需要删除也在图像中的其他页面的一部分我需要编写一个通用代码，可以对
opencv - 如何仅放大图像的几个点，图像处理
我正在研究一个问题，其中我缩小图像的尺寸，在缩小图像中找到类似于二进制图像的有趣点。现在我只想放大在缩小图像中找到的有趣点(即白色像素点)，而不是放大整个图像然后找到有趣的点。哪种技术可以最好地用于此
python - 图像处理:道路提取
Closed. This question needs debugging details。它当前不接受答案。想改善这个问题吗？更新问题，以便将其作为on-topic用于堆栈溢出。上个月关闭。 I
python - 从文本图像中删除分界 - 图像处理
嗨，我需要编写一个程序，从灰度图像中删除分界(图像中带有文本) 我阅读了有关阈值和模糊的信息，但我仍然不知道该怎么做。我的图像是这样的希伯来文本图像: 我需要删除分界线(假设分界线是图像中的最小元素
Python 图像处理 - 如何删除某些轮廓并将值与周围像素混合？
我正在做一个带有深度图像的项目。但是我的深度相机有噪音和像素读取失败的问题。有一些点和轮廓(尤其是边缘)的值为零。如何忽略这个零值并将其与周围的值混合？我试过 dilation和 erosion (

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - python中使用openCV进行多线程图像处理