gpt4 book ai didi

image - 用图像训练的人工神经网络

转载 作者:行者123 更新时间:2023-12-01 12:44:11 27 4
gpt4 key购买 nike

我有兴趣创建一个软件,它可以使用 Microsoft Kinect 检测笔之类的物体。我记忆了 100 张正面图像和 200 张负面图像,以便由人工神经网络拍摄。我的问题是:如何将这些图像转换为 ANN 的输入?我猜最后一层有一个神经元,因为一个输出是笔还是不是笔,我猜输入也是一个我想总共使用 3 层。但是我不知道是否应该在矩阵中转换正负图像或者我该怎么办?

最佳答案

首先,欢迎来到 Stackoverflow!

我个人从未使用 Kinect 进行图像识别,但如果可能的话,您应该将图像缩小到相当合理的大小,例如 100x100,这样它仍然易于管理。

您还应该尝试将图像转换为灰度,因为这也有助于提高计算效率、缩短开发时间,并且比 RGB 更容易上手。

输入层不会为 1,这是给定的。如果我们指的是具有 100x100 尺寸的图像,则输入总数应为 10000,每个像素一个。请记住,您正在尝试尽可能细地分解数据,以便 ANN 可以检测数据中的模式。

输出层实际上应该有 2 个神经元,这是有充分理由的。请记住,每个输出神经元都在测量输入属于相应类别的可能性。通过有 2 个神经元,每个神经元都可以代表正类(是的,这是一支笔)或负类(不,这不是笔)。因此,通过使用 2 个神经元,您可以获得图像属于该类别的概率,然后您可以选择最高值作为答案。

3 总层数应该足够了,您可能永远不需要更多。有一些非常好的文章可以帮助您确定要拥有的层数,例如 this one我希望这有帮助!如果您还有其他问题,请告诉我。

关于image - 用图像训练的人工神经网络,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21793661/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com