machine-learning - 神经网络测试用例-6ren

machine-learning - 神经网络测试用例

转载作者：行者123 更新时间：2023-11-30 08:52:48

25

4

在精密神经网络中增加~~测试用例~~训练数据的数量是否可能会导致问题(例如过度拟合)......？
增加~~测试用例~~训练数据数量总是好的吗？这总能带来转化吗？
如果不是，这些情况是什么..举个例子会更好..

谢谢

最佳答案

当您说“测试用例”时，我会假设您正在谈论数据实例。

让我们看几个场景:

各向异性

假设您有一个包含 1000 个实例的训练数据集，它们彼此显着相似，但资格数据集中的实例与其他实例显着不同你的训练数据。例如，您遇到一个问题，您尝试估计函数 y = mx + b .

假设您的某些数据集为您提供了帮助您估计 m 的样本等人帮你估算b 。如果您为神经网络提供 1000 个样本来帮助您估计 b但只有 5 个样本可以帮助您估算 m ，那么你的神经网络在估计时会表现得很差m 。您将过度拟合您的神经网络并添加更多样本来帮助您估计 b不会有任何帮助。

各向同性

现在假设您的数据集中的数据实例呈比例分布(请注意，我没有说等于)...并且您希望它们成比例，因为您可能需要更多数据实例来估计 m比您需要估计的b 。现在您的数据相对均匀，添加更多样本将为您提供更多机会，帮助您更好地估计函数。与y = mx + b从技术上讲，您可以拥有无限数量的数据实例(因为该线在两个方向上都是无限的)，这可能会有所帮助，但存在 yield 递减点。

yield 递减

与 y = mx + b例如，您可能有无限数量的数据实例，但如果您可以用 1,000 个实例来估计函数，那么向数据集中添加 100,000 个以上的数据实例可能没有用。在某些时候，添加更多实例不会导致更好的适应性，因此 yield 递减。

现在假设您正在尝试估计像 XOR 这样的 bool 函数:

A    B   A XOR B
1    1      0
1    0      1
0    1      1
0    0      0

在这种情况下，您根本无法添加更多数据，并且添加更多数据也没有意义...只有四个有效数据实例，这就是您所拥有的全部。对于此示例，根本没有必要添加更多数据实例。

结论

一般来说，添加更多数据实例将直接取决于您的问题:一些问题可能会从更多数据实例中受益，而其他问题可能会受到影响。您必须分析数据集，并且可能必须对数据集进行一些操作，以使您的样本更能代表真实世界的数据。你必须研究你想要解决的问题，了解它的领域，了解它拥有的数据样本，并且你必须做出相应的计划……机器学习/人工智能中没有一刀切的解决方案。

关于machine-learning - 神经网络测试用例，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/2753906/

25

4

0

文章推荐： python - scikit-learn - 根据新输入预测训练模型

文章推荐： matlab - 数据分类:sizes of training and test vectors

文章推荐： machine-learning - 将文档添加到评分的 TF-IDF 集合中？

文章推荐： open-source - 决策树归纳开源代码

c - 例 1-8 C 编程语言
我最近购买了《C 编程语言》并尝试了 Ex 1-8这是代码 #include #include #include /* * */ int main() { int nl,nt,nb;
php - 在 php SESSION 中使用空 - 0 例
早上好!我有一个变量“var”，可能为 0。我检查该变量是否为空，如果不是，我将该变量保存在 php session 中，然后调用另一个页面。在这个新页面中，我检查我创建的 session 是否为空，
python - 为什么有些参数需要定义，有些则不需要？ (艰难地学习 Python，例 25)
我正在努力完成 Learn Python the Hard Way ex.25，但我无法理解某些事情。这是脚本: def break_words(stuff): """this functio

首页

博学

6Ren·AI

商城