gpt4 book ai didi

Java + Hadoop + NoSql(使用什么组合)

转载 作者:可可西里 更新时间:2023-11-01 16:21:16 26 4
gpt4 key购买 nike

我是新手,我的要求如下:
我想处理带有电影评级(文本格式)的庞大文本数据集,并将它们存储在一些 NoSQL 数据库中,然后进行一些处理并推荐给定一部特定电影的电影。

所以我需要速度 - 我认为 Hadoop 会在这方面帮助我,而将数据保存在 NoSQL 数据库中会进一步帮助提高速度。我想知道其他一些方法是否广为人知以及 Java 使用了哪些组合

谢谢

最佳答案

有多大才算大?您可能想查看 Apache Mahout .它具有非常有效的数据结构,正是为了这个目的——为协同过滤算法存储和处理稀疏数据。它将在中等规模的机器上处理大约 1000 万个评级的数据集 + 如果您的数据集开始从一台机器增长,它支持使用 hadoop 进行拆分处理。

关于Java + Hadoop + NoSql(使用什么组合),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4568820/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com