gpt4 book ai didi

cluster-analysis - 为什么我们在研究中需要训练和测试数据集?

转载 作者:行者123 更新时间:2023-12-04 00:41:30 25 4
gpt4 key购买 nike

我是数据挖掘(文本聚类)研究领域的新手,我有几个关于训练和测试数据集的问题。

  1. 聚类是否需要训练和测试数据集?
  2. 为什么我们需要分成训练和测试数据集?

很抱歉菜鸟的问题希望群里的高手能帮帮我。

最佳答案

因为你的问题是关于聚类的:

在聚类分析中,通常没有训练或测试数据拆分

因为您在没有标签时进行聚类分析,所以您无法“训练”。

训练是机器学习的一个概念,训练-测试拆分用于避免过度拟合

但是如果您不学习标签,就不会过度拟合

正确使用聚类分析是一种知识发现方法。您想要发现数据中的一些新结构,而不是重新发现已标记的内容。

关于cluster-analysis - 为什么我们在研究中需要训练和测试数据集?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13394478/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com