gpt4 book ai didi

neural-network - 神经网络如何处理感兴趣区域较小的大图像?

转载 作者:行者123 更新时间:2023-12-01 11:40:14 25 4
gpt4 key购买 nike

如果我没理解错的话,在训练神经网络识别图像中的对象时,通常会将单个像素映射到单个输入层节点。然而,有时我们可能拥有一张只有一小部分感兴趣区域的大图。例如,如果我们正在训练一个神经网络来识别交通标志,我们可能会有交通标志只覆盖其中一小部分的图像,而其余部分则被道路、树木、天空等占据。创建一个神经网络试图从每个位置找到交通标志的方法似乎非常昂贵。

我的问题是,除了对图像进行预处理之外,是否有任何特定策略可以使用神经网络来处理这类情况?

谢谢。

最佳答案

通常不会为每个输入节点使用 1 个像素。进入您的网络的是特征向量,因此您应该输入实际的特征,而不是原始数据。输入原始数据(及其所有噪音)不仅会导致错误的分类,而且训练时间也会比必要的时间长。

简而言之:预处理是不可避免的。您需要更抽象的数据表示。有数百种方法可以解决您提出的问题。让我给你一些流行的方法。

1) 图像处理以找到感兴趣的区域。
当检测交通标志时,一个常见的策略是使用边缘检测(即与一些过滤器的卷积),应用一些启发式方法,使用阈值过滤器并隔离作为输入的感兴趣区域( Blob ,强连接组件等)到网络。

2) 在没有任何先验知识或图像处理的情况下应用特征。
Viola/Jones使用特定的图像表示,他们可以从中以非常快的方式计算特征。他们的框架已被证明可以实时工作。 (我知道他们的原始工作没有陈述神经网络,但我在我的论文中将他们的特征应用于多层感知器,所以你可以将它与任何分类器一起使用,真的。)

3) 深度学习。
学习更好的数据表示可以并入神经网络本身。这些方法是最受欢迎的研究 atm 之一。由于这是一个很大的话题,我只能给你一些关键词,让你自己去研究。 Autoencoders是学习有效表示的网络。可以将它们与传统的人工神经网络一起使用。 Convolutional Neural Networks乍一看似乎有点复杂,但值得一试。在神经网络的实际分类之前,它们具有子窗口卷积(边缘检测)和重采样的交替层。 CNN 目前能够在 OCR 中取得一些最好的结果。

在每种情况下,您都必须问自己:我是否 1) 为我的 ANN 提供了一个具有完成工作所需的所有数据的表示(一种不太抽象的表示)和 2) 远离太多噪音(从而保持足够的抽象)。

关于neural-network - 神经网络如何处理感兴趣区域较小的大图像?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21813997/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com