gpt4 book ai didi

machine-learning - 使用weka对传感器数据进行分类

转载 作者:行者123 更新时间:2023-11-30 08:51:47 24 4
gpt4 key购买 nike

我正在研究一个分类问题,它有不同的传感器。每个传感器收集一组数值。

我认为这是一个分类问题,并且想使用 weka 作为解决此问题的 ML 工具。但我不知道如何使用weka来处理输入值?哪个分类器最适合这个问题(特征的一个实例是一组数值)?

例如,我有三个传感器 A、B、C。我可以定义 5 个从所有传感器收集的数据作为一个实例吗?例如,A 的一个实例是{1,2,3,4,5,6,7},B 的一个实例是{3,434,534,213,55,4,7)。 C{424,24,24,13,24,5,6}。

非常感谢您花时间查看我的问题。

最佳答案

通常第一个尝试的分类器是朴素贝叶斯(你可以在Weka的“Bayes”目录下找到它),因为它速度快,参数少,并且每当训练样本时,分类精度都很难被击败很小。

随机森林(您可以在 Weka 的“Tree”目录下找到它)是另一个令人愉快的分类器,因为它几乎可以处理任何数据。只需运行它,看看它是否会给出更好的结果。可能只需将树的数量从默认的 10 增加到某个更高的值。既然你有 7 个属性,100 棵树就足够了。

然后我会尝试k-NN(你可以在 Weka 的“Lazy”目录下找到它,它被称为“IBk”),因为它通常会为各种类别的最佳单一分类器排名。数据集。 k-nn 的唯一问题是它对于大型数据集(> 1GB)的扩展性很差,并且需要微调邻居的数量k。该值默认设置为 1,但随着训练样本数量的增加,通常最好将其设置为 2 到 60 范围内的某个更高的整数值。

最后,对于一些朴素贝叶斯和 k-nn 都表现不佳的数据集,最好使用 SVM(在“函数”下,它称为“Lib SVM”)。然而,设置 SVM 的所有参数以获得有竞争力的结果可能很麻烦。因此,当我已经知道预期的分类精度时,我会将其留到最后。如果您有两个以上的类需要分类,则此分类器可能不是最方便的。

关于machine-learning - 使用weka对传感器数据进行分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17283183/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com