gpt4 book ai didi

machine-learning - 数据子集的分类器性能

转载 作者:行者123 更新时间:2023-11-30 09:38:46 24 4
gpt4 key购买 nike

我正在使用 Weka 对一组带标签的网页执行分类,并使用 AUC 测量分类器性能。我有一个单独的六级因子,未用于分类,我想知道分类器在该因子的每个级别上的表现如何。

我应该使用哪些技术或措施来测试数据子集上的分类器性能?

最佳答案

我不确定这是否正是您所要求的,但人们经常使用 cross-validation将一组数据分解为多个训练/测试子集,以更好地评估学习表现。

基本思想(例如 10 倍交叉验证)是:

  1. 将数据随机分为训练集和测试集
  2. 在训练集上训练分类器
  3. 评估其在测试集上的性能
  4. 使用不同的随机训练/测试分组重复步骤 1-3 九次

分类器的整体性能是其在所有 10 个测试集上的平均性能。

我环顾四周,发现 some examples of how to perform cross-validation programmaticallyvia the Weka UI .

关于machine-learning - 数据子集的分类器性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3663605/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com