gpt4 book ai didi

hadoop - 什么是 "Hadoop"- Hadoop 的定义?

转载 作者:可可西里 更新时间:2023-11-01 14:12:44 28 4
gpt4 key购买 nike

这很明显,我们都同意我们可以将 HDFS + YARN + MapReduce 称为 Hadoop。但是,Hadoop 生态系统中的其他不同组合和其他产品会怎样?

例如,HDFS + YARN + Spark 仍然是 Hadoop 吗? HBASE Hadoop 吗? 我猜我们考虑 HDFS + YARN + Pig Hadoop,因为 Pig 使用 MapReduce。

只有 MapReduce 工具被认为是 Hadoop,但任何其他在 HDFS + YARN 上运行的工具(如 Spark ) 是非 Hadoop 吗?

最佳答案

我同意您的看法,即“Hadoop” 术语没有有用的定义。 “我们有一个 Hadoop 集群” 可能有多种含义。

尽管在 http://hadoop.apache.org/#What+Is+Apache+Hadoop%3F 上有一个官方答案:

The Apache™ Hadoop® project develops open-source software for reliable, scalable, distributed computing.

The Apache Hadoop software library is a framework that allows for the distributed processing of large data sets across clusters of computers using simple programming models.

所以“Hadoop”是一个项目的名称,也是一个软件库。任何其他用法都是不明确的。

关于hadoop - 什么是 "Hadoop"- Hadoop 的定义?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28129491/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com