gpt4 book ai didi

Weka:训练集和测试集不兼容

转载 作者:行者123 更新时间:2023-12-01 00:02:00 35 4
gpt4 key购买 nike

我正在尝试使用 weka 和朴素贝叶斯分类器对一些网络帖子进行分类。

首先,我手动对许多帖子进行分类(大约 100 个负面帖子和 100 个正面帖子),然后我创建了一个具有以下形式的 .arff 文件:

@relation classtest
@attribute 'post' string
@attribute 'class' {positive,negative}
@data
'RT @burnreporter: Google has now indexed over 30 trillion URLs. Wow. #LeWeb',positive
'A special one for me Soundcloud at #LeWeb ',positive
'RT @dianaurban: Lost Internet for 1/2 hour at a conference called #LeWeb. Ironic, yes?',negative
.
.
.

然后我打开 Weka Explorer 加载该文件并应用 StringToWordVector 过滤器将帖子拆分为单个单词属性。

然后,在对我的数据集执行相同操作后,选择(在 weka 的分类选项卡中)naive bayes 分类器并选择 select test set,它返回 Train and test set are not compatible。我能做什么?谢谢!

最佳答案

可能属性的顺序在训练集和测试集中是不同的。

您可以按照 http://weka.wikispaces.com/Batch+filtering 中的描述使用批量过滤

关于Weka:训练集和测试集不兼容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13911199/

35 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com