gpt4 book ai didi

image-processing - 图像处理中的归一化

转载 作者:行者123 更新时间:2023-12-04 09:58:58 24 4
gpt4 key购买 nike

图像处理中归一化的正确含义是什么?我用谷歌搜索了它,但我有不同的定义。我将尝试详细解释每个定义。

核矩阵的归一化

如果归一化指的是一个矩阵(例如卷积滤波器的核矩阵),通常矩阵的每个值都除以矩阵的值之和,以使矩阵的值之和等于 1 (如果所有值都大于零)。这很有用,因为图像矩阵和我们的核矩阵之间的卷积给出了一个输出图像,其值介于 0 和原始图像的最大值之间。但是,如果我们使用 sobel 矩阵(有一些负值),这将不再正确,我们必须拉伸(stretch)输出图像以使所有值都在 0 和最大值之间。

图像归一化

我基本上找到了标准化的两个定义。第一个是“削减”过高或过低的值。即,如果图像矩阵具有负值,则将它们设置为零,如果图像矩阵的值高于最大值,则将它们设置为最大值。第二个是线性拉伸(stretch)所有值,以使它们适合区间 [0, max value]。

最佳答案

@Imanol 的回答很棒,我只想添加一些示例:
将输入标准化为 像素 明智或 数据集 明智。常见的三种归一化方案:

  • 标准化 0 和 1 之间的像素值:
  • img /= 255.0
  • 标准化介于 -1 和 1 之间的像素值(如 Tensorflow 所做的那样):
  • img /= 127.5
    img -= 1.0
  • 根据数据集均值和标准差进行归一化(与 Torch 一样):
  • img /= 255.0
    mean = [0.485, 0.456, 0.406] # Here it's ImageNet statistics
    std = [0.229, 0.224, 0.225]

    for i in range(3): # Considering an ordering NCHW (batch, channel, height, width)
    img[i, :, :] -= mean[i]
    img[i, :, :] /= std[i]

    关于image-processing - 图像处理中的归一化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33610825/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com