gpt4 book ai didi

r - 具有多个 ARFF 文件的 WEKA 预测

转载 作者:行者123 更新时间:2023-11-30 09:11:53 26 4
gpt4 key购买 nike

我对 WEKAARFF 文件相当陌生,目前正在使用其 GUI。我感到困惑的是如何使用多个 ARFF 文件进行预测(分类)?

例如,文件 A 有 3 个属性,"ID""attribute_1""attribute_2" ;而文件 B 有 2 个属性, "ID""Scores" (用于预测的主要属性)。

问题是,文件A中的每一行数据都是唯一的,但B中的数据却是重复的。这两个文件通过其“ID” 相关。换句话说,文件 B文件 A 中的每个元素存储一组“分数”

是否有关于如何将文件 AB 连接在一起的建议?或者有什么方法可以解决 WEKA 使其工作?

最佳答案

Weka 需要一个“扁平”表,即 arff 文件。这个过程也称为非规范化。有一个 weka 包(Denormalize),其中包含一个执行此操作的过滤器。

这里有一个如何扁平化事务数据的示例:https://weka.wikispaces.com/How+can+I+use+transactional+data+in+Weka%3F

在使用过滤器之前,您必须将两个文件合并在一起。如果您有 csv 文件或类似文件,您可以通过 Excel 实现此目的,请参阅示例:

https://superuser.com/questions/420635/how-do-i-join-two-worksheets-in-excel-as-i-would-in-sql

关于r - 具有多个 ARFF 文件的 WEKA 预测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33698496/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com