gpt4 book ai didi

machine-learning - 从更大的应用程序集中挑选一个训练集

转载 作者:行者123 更新时间:2023-11-30 09:53:59 25 4
gpt4 key购买 nike

我正在尝试对数据集执行情感分析。但是没有与我要分析的数据集类似的现有语料库可供我的分类器训练。我的问题如下:我可以使用该数据的随机采样子集进行训练/验证阶段,然后使用经过训练的分类器对更大的数据集进行分析吗?我计划通过向训练集中添加与应用程序数据集类似但不是来自该集的数据点来引入一些可变性。这是一种有效的方法吗?

最佳答案

您正在寻找的是交叉验证的标准程序。在交叉验证期间,您将数据拆分为(假设)80%-20% 的训练测试数据,并进行 5-10 个(取决于您拥有的数据大小)不同的拆分。因此,我建议您保留数据的子集,然后对该子集执行交叉验证。这是训练模型的最佳方法。

关于machine-learning - 从更大的应用程序集中挑选一个训练集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38608936/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com