- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我们正在寻找一种可行的方法来使用 OpenShift(基于 Docker)配置 Hadoop 生态系统集群。我们希望使用 Hadoop 生态系统的服务构建集群,即 HDFS、YARN、Spark、Hive、HBase、ZooKeeper 等。
我的团队一直将 Hortonworks HDP 用于本地硬件,但现在将切换到基于 OpenShift 的基础架构。 Hortonworks Cloudbreak 似乎不适合基于 OpenShift 的基础设施。我找到了 this描述了将 YARN 集成到 OpenShift 中的文章,但似乎没有更多可用信息。
在 OpenShift 上配置 Hadoop 生态系统集群的最简单方法是什么?手动添加所有服务感觉容易出错且难以管理。我偶然发现了这些独立服务的 Docker 镜像,但它无法与您通过 Hortonworks HDP 等平台获得的自动配置相提并论。任何指导表示赞赏。
最佳答案
如果您在 Openshift 中安装 Openstack,Sahara allows provisioning of Openstack Hadoop clusters
或者,Cloudbreak is Hortonwork's tool用于配置基于容器的云部署
两者都提供 Ambari,允许您使用与 HDP 相同的集群管理界面。
FWIW,我个人并没有找到将 Hadoop 放入容器中的原因。您的数据节点被锁定到特定磁盘。在单个主机上运行多个较小的 ResourceManager 没有任何改进。另外,对于 YARN,您将在容器中运行容器。而对于namenode,你必须有一个复制的Fsimage + Editlog,因为容器可以放在任何系统上
关于hadoop - 如何使用 OpenShift 配置 Hadoop 生态系统集群?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49691196/
我最近遇到了 HFOSS (人道主义免费开源软件)项目以及其他一些公司在做智能电网软件公司和其他类型的绿色软件项目。 由于我正在对该主题进行一些研究,并且因为谷歌在绿色/生态/人道主义/可持续性上的搜
我是一名优秀的程序员,十分优秀!