gpt4 book ai didi

hadoop - 云端小功能并行处理

转载 作者:可可西里 更新时间:2023-11-01 14:32:12 26 4
gpt4 key购买 nike

我有几百万/十亿 (10^9) 个数据输入集需要处理。它们很小 < 1kB。他们需要大约 1 秒的时间来处理。

我阅读了很多有关 Apache Hadoop、Map Reduce 和 StarCluster 的文章。但我不确定最有效和最快的处理方式是什么?

我正在考虑使用 Amazon EC2 或类似的云服务。

最佳答案

您可能会考虑像 Amazon EMR 这样的东西它负责处理 Hadoop 的很多管道。如果您只是想快速编写代码,hadoop 流、hive 和 PIG 都是很好的 hadoop 入门工具,不需要您了解 MapReduce 的所有来龙去脉。

关于hadoop - 云端小功能并行处理,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11637994/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com