gpt4 book ai didi

java - 将 kmeans 与 mahout 一起使用时忽略列

转载 作者:太空宇宙 更新时间:2023-11-04 12:50:25 24 4
gpt4 key购买 nike

您好,我有一组这种形式的数据:

12347,23.75580119032886
12348,57.97548386358446
12349,24.076027347616954
12350,19.670588100657742
12352,16.267473592256245

其中第一列是用户的 ID,第二列是其购买的值(value)。我使用 KMeans 算法和 mahout 将数据集分为 3 个集群。我的问题是 Id 列正在被使用,所以输出是错误的。有没有办法忽略第一列并仅对第二列进行聚类?谢谢。

最佳答案

使用映射缩减作业来适本地映射数据。

关于java - 将 kmeans 与 mahout 一起使用时忽略列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35889019/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com