gpt4 book ai didi

machine-learning - 机器学习是否真的需要数据增强

转载 作者:行者123 更新时间:2023-11-30 08:33:35 26 4
gpt4 key购买 nike

我有兴趣了解数据增强的重要性(以不同角度旋转、翻转图像),同时为机器学习问题提供数据集。

是否真的需要?或者无论数据转换有多么不同,使用的 CNN 网络也能处理这个问题?

所以我接受了 2 个类别的分类任务来得出一些结果

  1. 箭头形状
  2. 圆形

这个想法是只训练一个方向的形状(我采用了指向右侧的箭头)并检查具有不同方向的模型(我采用了向下的箭头),这在训练阶段根本没有给出。

训练中使用的一些样本

enter image description here enter image description here enter image description here enter image description here

测试中使用的一些示例

enter image description here enter image description here

这是我用于创建 tensorflow 模型的整个数据集。 https://bitbucket.org/akhileshmalviya/samples/src/bab50b85d826?at=master

我想知道我得到的结果,

(i) 除了一些向下的箭头之外,所有其他箭头都被正确预测为箭头。这是否意味着根本不需要数据增强?

(ii) 或者这是我用来理解数据增强重要性的正确用例?

请分享您的想法,我们将不胜感激任何帮助!

最佳答案

数据增强是一个依赖于数据的过程。

一般来说,当您的训练数据很复杂并且样本数量很少时,您就需要它。

神经网络可以轻松学习提取简单的模式,例如弧线或直线,这些模式足以对数据进行分类。

在您的情况下,数据增强几乎没有帮助,网络将学习提取的特征很容易并且彼此之间存在很大差异。

相反,当您必须处理复杂的结构(猫、狗、飞机等)时,您不能依赖边缘、弧线等简单特征。相反,您必须向网络表明您尝试分类的实例具有很高的方差,并且对于同一主题,提取的特征可以通过多种不同的方式进行组合。

想想一只猫:它可以是任何颜色,照片可以在不同的光线条件下拍摄,它的整个 body 可以处于任何位置,照片可以以一定的方向拍摄......为了正确分类如此不同的实例,网络必须学会提取鲁棒的特征,这些特征只有在看到大量不同的输入后才能学习。

就您而言,相反,简单的功能可以完全区分您的输入,因此任何类型的数据增强都可以提供一点帮助。

关于machine-learning - 机器学习是否真的需要数据增强,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44695825/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com