gpt4 book ai didi

python - 在图像 OpenCV 上滑动窗口

转载 作者:太空宇宙 更新时间:2023-11-03 22:13:12 25 4
gpt4 key购买 nike

我正在尝试定义一个扫描图像的窗口,我想在每个窗口中找到平均 RGB 值并输出它们。

我已经设法像这样获得整个图像的平均 RGB 值:

img = cv2.imread('images/0021.jpg')

mean = cv2.mean(img)

print mean[0]
print mean[1]
print mean[2]

给予:

#Output
51.0028081597
63.1069849537
123.663025174

我如何将这个平均函数应用于移动窗口并输出每个窗口的值?

编辑:

这是我现在拥有的:

img = cv2.imread('images/0021.jpg')

def new(img):
rows,cols = img.shape
final = np.zeros((rows, cols, 3, 3))
for x in (0,1,2):
for y in (0,1,2):
img1 = np.vstack((img[x:],img[:x]))
img1 = np.column_stack((img1[:,y:],img1[:,:y]))
final[x::3,y::3] = np.swapaxes(img1.reshape(rows/3,3,cols/3,-1),1,2)
b,g,r = cv2.split(final)
rgb_img = cv2.merge([r,g,b])
mean = cv2.mean(rgb_img)
print mean[0]
print mean[1]
print mean[2]

但现在我的输出为零。

最佳答案

我写了一个类似于给定链接的脚本。它基本上将您的 img 分成 3*3 个部分,然后计算每个部分的平均值(和标准差)。通过一些阵列优化,我认为您可以实时/在视频中使用它。

PS:除法应该是整数除法

编辑:现在脚本给出了 9 个输出,每个输出代表其自身区域的平均值。

import numpy as np
import cv2

img=cv2.imread('aerial_me.jpg')
scale=3
y_len,x_len,_=img.shape

mean_values=[]
for y in range(scale):
for x in range(scale):
cropped_image=img[(y*y_len)/scale:((y+1)*y_len)/scale,
(x*x_len)/scale:((x+1)*x_len)/scale]

mean_val,std_dev=cv2.meanStdDev(cropped_image)
mean_val=mean_val[:3]

mean_values.append([mean_val])
mean_values=np.asarray(mean_values)
print mean_values.reshape(3,3,3)

输出是每个窗口的bgr平均值:

[[[  69.63661573   66.75843063   65.02066449]
[ 118.39233345 114.72655391 116.14441964]
[ 159.26887164 143.40760348 144.63208436]]

[[ 75.50831044 107.45708276 103.0781851 ]
[ 108.46450034 141.52005495 139.84878949]
[ 122.67583265 154.86071992 153.67907072]]

[[ 83.67678571 131.45284169 128.27706902]
[ 86.57919815 129.09968235 128.64439389]
[ 90.1102402 135.33173999 132.86622807]]]
[Finished in 0.5s]

关于python - 在图像 OpenCV 上滑动窗口,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28591549/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com