gpt4 book ai didi

apache - Hadoop发布版本困惑

转载 作者:可可西里 更新时间:2023-11-01 14:45:48 26 4
gpt4 key购买 nike

我试图弄清楚 hadoop 的不同版本,但在阅读此 page 后我感到困惑.

Download
1.2.X - current stable version, 1.2 release
2.2.X - current stable 2.x version
2.3.X - current 2.x version
0.23.X - similar to 2.X.X but missing NN HA.
Releases may be downloaded from Apache mirrors.

enter image description here

问题:

  1. 我认为任何以 0.xx 开头的版本都意味着它是 alpha 版本,不应在产品中使用,是这样吗?
  2. 0.23.X 和 2.3.X 有什么区别?它提到它们相似但缺少名称节点?高可用性? 0.23 和 2.3 之间有什么相关性吗?是不是因为他们开发代码的时候,PMC组说“伙计!这太不成熟了,应该从0开始,既然他们是同一个产品,我就保持数字不变?”
  3. 当我查看新 hadoop 的源代码时,我发现 jobtracker 类原来是一个虚拟类。我正在设想 jobtracker 和 tasktracker,即。 Mapreduce1 将在 Hadoop 的路线图上慢慢淡出,在另一种情况下,Map Reduce Job 的接口(interface)可能保持不变,但第二代 Hadoop (YARN) 将完全用 ResourceManager 取代 Jobtracker 和 Tasktracker 的想法。等等

抱歉,这个问题可能有点困惑,因为我对版本号感到很困惑。弄清楚后,我会修改问题。

最佳答案

首先:Hadoop v1 和 v2(又名 YARN)之间存在重大差异。 v1 的 NameNode 和 JobTracker 被新的 ResourceManager 取代,以获得更好的可扩展性。这就是为什么两者都会在开发后期消失。

其次:0.X 版本是微妙的,没有关于 alpha 版本的提示:OpenSSL 十多年来一直是 0.9 版本(en.wikipedia.org/wiki/OpenSSL#Major_version_releases),尽管它被认为是事实上的标准或引用执行。许多财富 500 强公司都信赖它。

Hadoop 也是如此。 0.23 版本指的是具有 v2 实现的 Hadoop v1 架构(高可用性除外,因为 NameNode 仍然是 v1 的)。所以 0.23 和 2.3 大致相同,并继续并行老化。他们将其命名为 0.X,因为 1.X 已经在使用中。他们只是不希望 1.X 继续老化以表明 2.X 是可行的方法——只有在依赖 1.X 的架构时才可以使用 0.X,但另一方面希望从2.X 的当前发展。

底部部分试图解释这一点,但也更好一些:http://wiki.apache.org/hadoop/Roadmap .这里的顶部做得更好一点:http://hadoop.apache.org/releases.html

希望这对您有所帮助...

关于apache - Hadoop发布版本困惑,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23787587/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com