gpt4 book ai didi

machine-learning - 刷新监督学习的训练数据——如何做?

转载 作者:行者123 更新时间:2023-11-30 08:28:38 24 4
gpt4 key购买 nike

我们有一个网页分类器。分类器模型是使用大约两年前的训练数据构建的。我们注意到模型的性能不断恶化,我们假设这是由于网页的属性随着时间的推移而变化(主要是使用的单词和术语,还有拓扑、html 标签等)。

您将如何解决这个问题?我们是否简单地重新构建整个训练数据并重新学习新模型?有捷径吗?是否有一些关于如何做到这一点的常见做法或论文?请注意,我们非常迷恋监督学习方法,系统管理员训练分类器,评估其在测试集上的性能,然后将分类器安装在“生产”系统中。

希望这不是太模糊......

最佳答案

可能需要考虑许多因素,主要是分类器的状态和数据。

如果您不需要因更改网络协议(protocol)而需要任何新输入,那么您可以根据新数据重新训练现有分类器。

如果分类器未被设计为针对新数据进行重新训练,则可能很难挽救旧模型。同样,如果输入或输出发生了变化,构建新的分类器也可能会更容易。

我不知道您正在使用什么分类器,也不知道重新训练或处理数据的方法,因此我无法为您面临的问题提供直接答案,或者是否有任何解决问题的捷径。这实际上取决于分类器的可访问性以及维护它的成本。

正如您在上面的问题中所述,建议在将新分类器应用于生产环境之前对其进行测试和比较,以确认其满足要求。

关于machine-learning - 刷新监督学习的训练数据——如何做?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25869233/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com