gpt4 book ai didi

weka - 如何忽略一个功能,同时将其作为 Weka GUI 中功能集的一部分包含在内

转载 作者:行者123 更新时间:2023-12-04 16:54:15 25 4
gpt4 key购买 nike

我正在使用 Weka GUI 在在线帖子上运行 NaiveBayes 分类器。我正在尝试跟踪错误预测的实例(在线帖子),以便我可以进一步了解如何改进功能。

目前,我有一个解决方法:我生成包含唯一 ID 的数据,当我导入到 Weka 时,我删除了 uniqueID。然后我附加了预测附加程序,它将预测结果保存到一个 .arff 文件中。我通读了该文件以查找性能不佳的实例。对于错误分类的实例,我使用某些特征值为每个实例提供足够独特的值,并从包含唯一 ID 的原始数据中找到具有相同值的实例。如您所见,这是一个真正耗时的过程。

我很想知道是否有办法忽略一个特征,在我的例子中是实例的唯一 ID,同时在运行分类器时将其作为数据的一部分。

谢谢你。

最佳答案

我不确定 weka GUI 是否有直接选项。但是,您可以通过命令行实现相同的目的

java weka.classifiers.meta.FilteredClassifier -F weka.filters.unsupervised.attribute.RemoveType -W weka.classifiers.trees.RandomForest -t G:\pub-resampled-0.5.arff -T G:\test.csv.arff -p 1 -distribution > G:\out.txt

在上面的例子中,第一个属性是一个标识符(字符串)。 RemoveType 过滤器将在构建模型时删除所有字符串字段。但是,您仍然可以通过将参数作为参数传递给 来要求 weka 将该标识符作为输出(预测)的一部分包含在内。 -p .在我的情况下,第一个属性 (partner_id) 是标识符,因此它与预测一起列在输出中。 (-distribution 选项是输出所有类标签的预测分数)。您可以从 http://weka.wikispaces.com/Instance+ID 获得更多详细信息
=== Predictions on test data ===

inst# actual predicted error distribution (partner_id)
1 1:? 2:0 0,*1 (8i7t3)
2 1:? 2:0 0,*1 (8i7u1)
3 1:? 2:0 0,*1 (8i7um)
4 1:? 2:0 0.1,*0.9 (8i7ux)
5 1:? 2:0 0,*1 (8i7va)
6 1:? 2:0 0,*1 (8i7vb)
7 1:? 2:0 0,*1 (8i7vf)

希望你觉得这有帮助..

关于weka - 如何忽略一个功能,同时将其作为 Weka GUI 中功能集的一部分包含在内,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12550032/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com