gpt4 book ai didi

hadoop - 我想通过mahout mapreduce工作获取距离矩阵

转载 作者:行者123 更新时间:2023-12-02 20:09:10 25 4
gpt4 key购买 nike

我有这些输入文件

id, feature1, feature2, ...
0, 0, 1, 1, 0, 0, 0, ...
1, 0, 0, 1, 0, 1, 0, ...
2, 1, 0, 0, 0, 0, 0, ...
3, 0, 0, 0, 0, 1, 0, ...

我想使用mapreduce作业通过hadoop或mahout获取其距离矩阵。
但是mahout没有计算距离矩阵的方法。
我该怎么办?

谢谢您的帮助。

最佳答案

您可以使用Mahout自己计算每条记录之间的距离。
使用DistanceMeasure class的distance方法,但是必须首先将输入文件转换为SequenceFile。

关于hadoop - 我想通过mahout mapreduce工作获取距离矩阵,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18840277/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com