gpt4 book ai didi

hadoop - 哪些类型的任务/应用程序可以使用Apache Hadoop(MapReduce函数)

转载 作者:行者123 更新时间:2023-12-02 20:14:24 25 4
gpt4 key购买 nike

我不了解Hadoop可使用哪些类型的应用程序。是否必须针对hadoop / mapreduce量身定制每个任务。例如,您可以仅将与其关联的任何长时间运行的Java关联吗?还是您必须专门针对hadoop量身定制应用程序/任务。我想一个很好的例子是使用lucene和hadoop进行索引。

最佳答案

MapReduce是一种处理模型;它准确地告诉您您的处理任务应该适合什么。

  • 您的处理必须是面向批处理的
  • 您必须能够将您的工作转换为(一组) map 并减少步骤。
  • 为了充分利用MapReduce的可伸缩性属性,您必须能够将工作拆分为足够的独立(!!)片段,可以分别处理。

  • Hadoop具有MapReduce(除其他功能外)的另一个优点是,您实际上可以在1000个并行系统上可靠地运行作业(如果您有足够的独立组件)。

    考虑到这些限制,有些事情无法完成,很多事情可以完成。
    分析日志文件(即大量独立的行)甚至是网络分析(单个访问者/ session 所做的每个事件都可以分别处理)是最常见的应用程序。

    所以是的,您的任务必须进行转换以适合模型才能生效。

    关于hadoop - 哪些类型的任务/应用程序可以使用Apache Hadoop(MapReduce函数),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5353794/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com