gpt4 book ai didi

java - 稀疏数据的离散和连续分类器

转载 作者:塔克拉玛干 更新时间:2023-11-01 22:57:52 25 4
gpt4 key购买 nike

我正在尝试对包含离散和连续特征的示例进行分类。此外,该示例表示稀疏数据,因此即使系统可能已经接受了 100 个特征的训练,该示例也可能只有 12 个。

用于完成此任务的最佳分类器算法是什么?我一直在研究 Bayes、Maxent、决策树和 KNN,但我不确定是否完全符合要求。我发现的最大症结是大多数实现不支持稀疏数据集离散和连续特征。谁能推荐符合这些标准的算法和实现(最好是 Python)?

到目前为止我看过的库包括:

  1. Orange (主要是学术性的。实现不是非常有效或实用。)
  2. NLTK (也是学术性的,虽然有很好的 Maxent 实现,但不处理连续特征。)
  3. Weka (还在研究这个。似乎支持范围广泛的算法,但文档很差,所以不清楚每个实现支持什么。)

最佳答案

Weka (Java) 满足您的所有要求:

看看这个 Pentaho wiki获取文档、指南、视频教程等的链接列表......

关于java - 稀疏数据的离散和连续分类器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2500467/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com