gpt4 book ai didi

java - 如何使用java编程删除微阵列数据中的冗余元组?

转载 作者:行者123 更新时间:2023-12-02 08:35:15 24 4
gpt4 key购买 nike

在微数组数据的数据挖掘软件WEKA中,如何从现有数据集中删除冗余元组?去除冗余的代码应该是JAVA。

即数据集包含诸如

之类的数据
H,A,X,1,3,1,1,1,1,1,0,0,0
D,R,O,1,3,1,1,2,1,1,0,0,0
H,A,X,1,3,1,1,1,1,1,0,0,0
C,S,O,1,3,1,1,2,1,1,0,0,0
H,A,X,1,3,1,1,1,1,1,0,0,0

这里元组 1,4,5 是多余的。

代码应返回以下 REDUNDANCY REMOVED 数据集...

H,A,X,1,3,1,1,1,1,1,0,0,0
D,R,O,1,3,1,1,2,1,1,0,0,0
C,S,O,1,3,1,1,2,1,1,0,0,0

最佳答案

您可以使用实现 Set 的类之一如java.util.HashSet .

您可以将数据集加载到 Set 中,然后通过 Set.toArray() 方法转换为数组或通过迭代集合来提取它们。

Set<Tuple> tupleSet = new HashSet<Tuple>();

      for (Tuple tuple: tupleList) {        tupleSet.add(tuple);    }  // now all of your tuples are unique  for (Tuple tuple: tupleSet) {        System.out.println("tuple: " + tuple);  }  

关于java - 如何使用java编程删除微阵列数据中的冗余元组?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2046745/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com