gpt4 book ai didi

hadoop - clusteredPoints聚类结果消失[mahout]

转载 作者:行者123 更新时间:2023-12-02 21:42:34 24 4
gpt4 key购买 nike

我得到了CSV和TEXT格式的结果,如下所示。

CSV:

0,Sports_38.txt
1,Sports_23.txt
2,Sports_36.txt
3,Sports_13.txt
4,Sports_31.txt,Sports_32.txt
5,Sports_28.txt,Sports_29.txt
6,Sports_2.txt
9,Sports_15.txt

文本:
{"identifier":"VL-1","r":[],"c":[...,"n":7}
Top Terms:
什 => 15.829998016357422
利物浦 => 13.629814147949219
克 => 11.317766189575195
格 => 10.938775062561035
特 => 10.842317581176758
尔 => 10.447234153747559
切尔西 => 9.742402076721191
比赛 => 8.247735023498535
表现 => 7.909337520599365
批评 => 7.462332725524902

我注意到CSV文件中的VL-1仅1点,而TEXT文件中的VL-1只有7点(VL-1的“n”等于7)。

为什么有些点消失了?我如何获得每个点的集群?

非常感谢。

最佳答案

如果数据大一点,我也会得到空的clusteredPoints。

我终于自己找到了原因。

在Kmeans.run的第8个参数中,clusterClassificationThreshold应该为0.(mahout 1.0)

检查此:http://mail-archives.apache.org/mod_mbox/mahout-user/201211.mbox/%3C50B62629.5020700@windwardsolutions.com%3E

关于hadoop - clusteredPoints聚类结果消失[mahout],我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27622298/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com