gpt4 book ai didi

python - 为什么应用高斯滤镜后图像的亮度会降低?

转载 作者:行者123 更新时间:2023-12-02 16:19:51 28 4
gpt4 key购买 nike

我刚刚从这个博客学习了如何从头开始将高斯滤波器应用于 python 中的灰度图像:http://www.adeveloperdiary.com/data-science/computer-vision/applying-gaussian-smoothing-to-an-image-using-python-from-scratch/

现在我想将高斯滤波器应用于 3 channel (RGB)图像。
为此,我实现了代码,但我得到的输出是亮度非常低的模糊图像。此外,图像的边缘没有正确模糊。
这是我的代码:

# import libraries
import cv2
import numpy as np
import os
import matplotlib.pyplot as plt
%matplotlib inline
import cv2

# loading image
img_orig = cv2.imread('home.jpg')

# convert GBR image to RGB image
img_orig = cv2.cvtColor(img_orig, cv2.COLOR_BGR2RGB)

# Gaussian function
def dnorm(x, mu, sd):
return 1 / (np.sqrt(2 * np.pi) * sd) * np.exp(-((x-mu)/sd)** 2 / 2)

# function for making gaussian kernel
def gaussian_kernel(kernel_size, mu = 0):
# initializing mu and SD
sd = np.sqrt(kernel_size)

# creating 1D kernel
kernel_1D = np.linspace(-(kernel_size // 2), kernel_size // 2, kernel_size)

# normalizing 1D kernel
for i in range(kernel_size):
kernel_1D[i] = dnorm(kernel_1D[i], mu, sd)

# creating 2D kernel
kernel_2D = np.outer(kernel_1D, kernel_1D)
kernel_2D /= kernel_2D.max()

return kernel_2D


这是 11 X 11 内核的样子:
enter image description here
# Covolution function with zero padding
def convolution(image, kernel):
# find row and column of 3 channel (RGB) image
img_row, img_col, img_channel = image.shape

kernel_size = kernel.shape[0]
padding_width = (kernel_size - 1) // 2

#initialize output image
output = np.zeros(image.shape, dtype = np.uint8)

# initialize padded image with zeros
padded_img = np.zeros((img_row + 2*padding_width, img_col + 2*padding_width, img_channel), dtype = np.uint8)

# copy orignal image inside padded image
padded_img[padding_width : padding_width + img_row, padding_width : padding_width + img_col] = image

# average pixel values using gaussian kernel
for i in range(img_row):
for j in range(img_col):
# average each pixel's R channel value
output[i, j, 0] = np.sum(padded_img[i : i+kernel_size, j : j+kernel_size, 0] * kernel) // (kernel_size * kernel_size)

# average each pixel's G channel value
output[i, j, 1] = np.sum(padded_img[i : i+kernel_size, j : j+kernel_size, 1] * kernel) // (kernel_size * kernel_size)

# average each pixel's B channel value
output[i, j, 2] = np.sum(padded_img[i : i+kernel_size, j : j+kernel_size, 2] * kernel) // (kernel_size * kernel_size)

return output

def gaussian_filter(image, kernel_size = 3):
# initialize mu
mu = 0

# create gaussian kernel
kernel = gaussian_kernel(kernel_size, mu)

# apply convolution to image
conv_img = convolution(image, kernel)

# return blurred image
return conv_img


高斯滤波器的测试代码:
plt.figure(figsize = (7, 5))
print('orignal image')
plt.imshow(img_orig)
plt.show()

plt.figure(figsize = (7, 5))
print('blurred image')
plt.imshow(gaussian_filter(img_orig, 11))
plt.show()

输出:
enter image description here

与 openCV GaussianBlur 对比:
print('openCV blurred image')
plt.imshow(cv2.GaussianBlur(img_orig, (11,11), 0))
plt.show()

输出:
enter image description here

我的问题是:
1)为什么我得到一个沉闷的图像作为输出。
2) RGB 图像的高斯滤波器的上述实现是否错误?如果它是错误的,我怎样才能使它正确?
3)为什么边缘没有正确模糊(见边缘的黑色阴影)?
4) 与 OpenCV GaussianBlur 相比,高斯滤波器的上述实现需要很长时间才能执行。我怎样才能使它有时间效率?

最佳答案

有两件事是错误的,导致图像强度无法保留:首先通过除以最大值来归一化内核,然后在卷积中除以内核中的样本数。当您创建内核时,通过除以内核值的总和,而不是这两个规范化,只规范化一次。这使得内核权重的总和等于 1,并使卷积保持平均图像强度。请注意,卷积计算的是局部加权平均值;在加权平均中,我们需要将权重加到 1 以避免偏差。

暗边是由填充引起的:你用零(黑色)填充,它与卷积中图像边缘的值混合。 OpenCV 可能使用不同的边界条件或图像填充。典型的选项包括镜像值,或者只是将边缘值扩展。

最后,您的代码运行缓慢的主要原因是您在 Python 中使用了循环。 Python 是一种解释型语言,因此速度很慢。你可以使用 Numba 来加速循环(它是 Python 的即时编译器),或者简单地使用 NumPy 中的卷积,它是用编译语言实现的。

你的代码很慢的另一个原因(在你修复第一个之前这并不重要)是你没有利用高斯的可分离性。您可以通过将两个 1D 高斯相乘来构建 2D 高斯,但是您可以依次应用两个 1D 卷积。对于您的 11x11 内核示例,计算成本从 11*11=121 次乘法和加法减少到 11+11=22 次乘法和加法。内核越大,速度增益越好。

关于python - 为什么应用高斯滤镜后图像的亮度会降低?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60987086/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com