gpt4 book ai didi

java - 提取Weka中的重要属性

转载 作者:塔克拉玛干 更新时间:2023-11-02 20:10:32 24 4
gpt4 key购买 nike

这是个新手问题,所以请持保留态度。

我是数据挖掘领域的新手,正在努力思考这个话题。现在我正在尝试完善我现有的模型,以便更好地对实例进行分类。问题是,我的模型有大约 480 个属性。我确信并非所有这些都是相关的,但我很难指出哪些确实重要。

问题是:拥有有效的训练和测试集,是否可以使用某种数据挖掘算法来丢弃属性这似乎对分类质量没有任何影响?

我正在使用 Weka。

最佳答案

您应该使用 Weka 拥有的一些Classifier 算法进行测试。

基本思想是使用交叉验证选项,这样您就可以看到哪种算法能为您提供最佳的正确分类实例值。

我可以给你一个我的训练集的例子,使用交叉验证选项并选择折叠 10。

如您所见,使用 J48 分类器我将拥有:

Correctly Classified Instances        4310               83.2207 %
Incorrectly Classified Instances 869 16.7793 %

如果我将使用例如 NaiveBayes 算法,我将拥有:

Correctly Classified Instances        1996               38.5403 %
Incorrectly Classified Instances 3183 61.4597 %

依此类推,值因算法而异。

因此,请测试尽可能多的算法,看看哪一个算法能为您提供最佳的正确分类实例/消耗时间。

关于java - 提取Weka中的重要属性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14243322/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com