gpt4 book ai didi

machine-learning - 大量属性的最佳分类器

转载 作者:行者123 更新时间:2023-11-30 09:38:16 25 4
gpt4 key购买 nike

我有一个由 940 个属性和 450 个实例构建的数据集,我正在尝试找到最佳分类器以获得最佳结果。我使用了 WEKA 建议的每个分类器(例如 J48、costSensitive、多个分类器的组合等)我发现的最好的解决方案是 J48 树,准确度为 91.7778 %混淆矩阵为:

394  27 |   a = NON_C
10 19 | b = C

我希望在 TN 和 TP 的混淆矩阵中获得更好的结果,每个结果至少有 90% 的准确度。我可以做些什么来改进这一点(例如扫描所有选项的长时间运行分类器?我没有想到的其他想法?这是文件:

https://googledrive.com/host/0B2HGuYghQl0nWVVtd3BZb2Qtekk/

请帮忙!!

最佳答案

我猜你有一个数据集并且只是尝试了所有可能的算法......

通常,思考一下问题是件好事:

  1. 仅查找并使用相关功能(属性),否则该任务可能会很吵。相关特征 = 具有较高特征的特征与类别 (NON_C,C) 的相关性。

  2. 您的数据集存在偏差,即 NON_C 的数量远高于 C。有时,在正例和负例(在您的情况下为 NON_C 和 C)示例的相同部分上训练您的算法可能会有所帮助。并在自然(真实)部分上进行交叉验证

  3. 与训练数据的数量相比,训练数据的大小很小特征。也许增加实例数量会有所帮助......

    ...

关于machine-learning - 大量属性的最佳分类器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20701172/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com