gpt4 book ai didi

machine-learning - 在共享任务中使用训练数据和测试数据

转载 作者:行者123 更新时间:2023-11-30 09:28:54 24 4
gpt4 key购买 nike

我正在处理这个共享任务 http://alt.qcri.org/semeval2017/task4/index.php?id=data-and-tools

这只是 Twitter 情绪分析。由于我对机器学习还很陌生,因此我不太确定如何使用训练数据和测试数据。

因此,共享任务提供了两组相同的 Twitter 推文,一组没有结果(训练),一组有结果。

我目前对在机器学习中使用此类数据的理解如下:

  • 训练集:我们应该将其分为训练和测试部分(也许 90% 的训练和 10% 的测试?)

但是单独的测试数据的存在有点令人困惑。

我们是否应该使用“训练集”的 10% 部分在测试中获得的结果,并将其与“测试集”的实际结果进行比较?

有人可以纠正我的理解吗?

最佳答案

训练机器学习模型时,您将向算法提供名为训练集的数据集,在此阶段,您将告诉算法您放入的每个样本的基本事实是什么算法,这样,算法就会从您提供给它的每个样本中学习。 训练集通常占整个数据集的80%,另外20%的数据集是测试集,在这种情况下,你知道什么是基本事实每个样本,但你让你的算法预测它认为你让它预测的每个样本的真相是什么。对测试集的所有预测都是基于算法从您之前输入的训练集中学到的知识。在对测试集做出所有预测后,您可以检查您的模型基于基本事实与模型所做的预测相比有多准确。

关于machine-learning - 在共享任务中使用训练数据和测试数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47661400/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com