gpt4 book ai didi

r - 在Hadoop群集,Apache Mahout上运行建议或将R与Hadoop一起使用(通过hadoop流/RHIPE/RHadoop等),哪种方法更好?

转载 作者:行者123 更新时间:2023-12-02 22:00:26 25 4
gpt4 key购买 nike

我是大数据新手,正在寻找一个好的平台来执行推荐,聚类和分类。我了解Mahout有很多算法可以做到这一点。同样,R本身是一个非常好的分析工具,对于实现此目标而言,其作用更大。因为我正在研究大数据,所以如果我决定走这条路,我将使用R + hadoop(通过流/ RHIPE / RHadoop等)。
考虑到所用语言(mahout中的Java和R)的复杂性差异对我而言不是一个因素,我正在寻求在性能,可伸缩性,易用性,成熟度等方面进行比较。

最佳答案

Mahout集成了许多算法,并处理三个问题
(1)推荐(协作过滤算法)
(2)聚类
(3)分类

R仅用于统计,因此,如果您要执行上述三个任务,Mahout是一个很好的工具。

顺便说一句,Mahout是一个Maven项目,因此您需要安装Maven。

关于r - 在Hadoop群集,Apache Mahout上运行建议或将R与Hadoop一起使用(通过hadoop流/RHIPE/RHadoop等),哪种方法更好?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17162870/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com