gpt4 book ai didi

machine-learning - 神经网络模型架构每像素分类

转载 作者:行者123 更新时间:2023-11-30 08:43:59 25 4
gpt4 key购买 nike

我熟悉 (C)NN 一般如何处理分类问题(2d 图像 -> 1 类),但我不知道如何构建一个网络来获取 2d 图像并输出 2d 矩阵分类值。

实际上,我有一组 NxN 图像(1 个 channel ),我想在“每个像素”的基础上对其进行分类。我希望输出是 NxN 类集,这样对于位置 (a,b) 处的像素,结果将是输入图像中像素 (a,b) 的分类结果。

模型架构有什么帮助吗?

附注我听说过基于补丁的方法,但我想将整个 NxN 图像输入到网络中而不需要“打补丁”。

谢谢!乔

最佳答案

总的来说,这个任务没有什么特别的。 DNN 可以同时执行多个分类或回归任务。由于权重是共享的,您可以确保在每个像素的分类过程中,一个像素与所有其他像素之间存在某种联系。

长话短说,解决这个问题的可能算法:

1) 确保您有一个训练集,其中输入有 NxN 图像,输出有 NxN 目标类标签矩阵(每个像素的类标签)

2) 使用通常用于图像分类的架构构建一些 DNN。就像几个带有 max-pooling 的卷积层,后面跟着 2-3 个全连接的 ReLU 层。

3)确保输出层的大小为 NxN 并且不是 softmax 层(再次使用 ReLU)

4)训练它!

这应该工作得很好。我还可以向您保证,从 DNN 获得多个半独立输出并不罕见。例如here使用相同的网络同时定位所有面部关键点(眼睛、嘴巴、 Nose 等)。

关于machine-learning - 神经网络模型架构每像素分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38445492/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com