gpt4 book ai didi

machine-learning - weka 中看不见的标称值

转载 作者:行者123 更新时间:2023-11-30 08:24:51 24 4
gpt4 key购买 nike

我有一个数据集,其中包含一些标称值作为特征。我的训练集有一组标称特征的值,这些值在我的测试集中不存在。例如我在训练集中的特征对应于

@attribute h4 {br,pl,com,ro,th,np}

测试集中有相同的特征

@attribute h4 {br,pl,abc,th,def,ghi,lmno}

我相信正因为如此,weka 不允许我在测试集上重新评估我在训练集上构建的模型。有没有解决的办法?我错过了什么吗?

编辑:我正在使用 RandomForest 分类器。

谢谢

最佳答案

Weka 寻求测试集中使用的所有标称值也存在于训练集中,因为分类器应该在进行预测之前进行学习。

Weka 还使用标称值及其指数;因此,对同一属性的标称值使用相同的顺序以获得可靠的结果非常重要。

在您的情况下,只需对训练集和测试集以相同的顺序使用相同的值(涵盖所有值)即可。

您的组合值{br,pl,com,ro,th,np,abc,th,def,ghi,lmno}可用于训练集和测试集。

关于machine-learning - weka 中看不见的标称值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20258690/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com