gpt4 book ai didi

machine-learning - Weka,无法让最近的邻居使用当前的测试和训练集

转载 作者:行者123 更新时间:2023-11-30 09:12:38 25 4
gpt4 key购买 nike

目前我正在使用 Weka,我正在尝试使用最近邻方法对我的测试集进行分类。我的训练集和测试集都有 11 列数值,最后一列是要分类的列。两者均已使用 Weka 工具从 .csv 转换为 .arff。

preview training set

preview test set

首先,我上传了训练集,并在“测试选项”下的“分类”选项卡中选中了“使用训练集”。我选择了“IBk”分类器并将邻居数设置为 10。(错误的)输出是这样的:

training set classify

接下来我检查了“提供的测试集”并上传了我的测试集。只有最后一列是空的(除了标题)。但是当我尝试运行它时,我得到以下输出,表示没有被分类:

testing set classify

此时我只是不明白该怎么办。据我所知,我的测试和训练集是正确的,因为除了列中的数值之外,它们是相同的,并且我只是在训练集上进行训练后尝试使用我的测试集......在我的某个地方我做了一些非常错误的事情。

最佳答案

问题在于对类属性设置为 ?empty 的测试集进行评估。您将在训练集上获得一些结果,因为对于训练数据,您知道所有数据标签。但对于标签未知的测试集,您如何知道分类器预测 y 是给定实例的正确类还是仅仅是错误分类?这就是为什么:您可以获得测试实例的预测标签,但无法进行任何评估

以下内容仅为假设,与您的数据没有任何关系:

例如,在训练数据上,您可能会得到如下内容:

=== Error on training data ===

Correctly Classified Instances 4 80 %
Incorrectly Classified Instances 1 20 %
Kappa statistic 0.6154
Mean absolute error 0.2429
Root mean squared error 0.4016
Relative absolute error 50.0043 %
Root relative squared error 81.8358 %
Total Number of Instances 5

但是对于未知的测试数据,输出可能如下所示:

=== Error on test data ===

Total Number of Instances 0
Ignored Class Unknown Instances 5


=== Confusion Matrix ===

a b <-- classified as
0 0 | a = 1
0 0 | b = -1

但是,您可以对未知数据实例进行预测,如下所示:

=== Predictions on test data ===

inst# actual predicted error prediction (feature1,feature2,feature3,feature4)
1 1:? 1:1 1 (1,7,1,0)
2 1:? 1:1 1 (1,5,1,0)
3 1:? 2:-1 0.786 (-1,1,1,0)
4 1:? 2:-1 0.861 (1,1,1,1)
5 1:? 2:-1 0.861 (-1,1,1,1)

=== Confusion Matrix ===

a b <-- classified as
2 1 | a = 1
0 2 | b = -1

关于machine-learning - Weka,无法让最近的邻居使用当前的测试和训练集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29028986/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com