gpt4 book ai didi

hadoop - 在Kubernetes上使用Hadoop

转载 作者:行者123 更新时间:2023-12-02 22:00:28 24 4
gpt4 key购买 nike

我开发了一个基于Hadoop的大数据分析系统。

我想在Kubernetes上将系统容器化。
现在,我在 Helm 上使用了稳定的hadoop图表来设置hadoop,但是我分析的数据通常高达100GB。

而kubernetes只能使用/目录的功能。换句话说,我的hadoop作业无法使用其他磁盘的资源。

Kubernetes是否还有其他方法可以将其他磁盘资源用作容器作业(与卷不同)。

或者我可以在非系统磁盘上设置Kubernetes的工作程序节点吗?

最佳答案

based on Hadoop



您可以将Hadoop 兼容文件系统与任何Hadoop-API系统一起使用,包括Kubernetes上的Apache Spark。

您不需要 而是 Hadoop / YARN / MapReduce才能“基于Hadoop”

换句话说,请尝试在Rook专案(Ceph)或MinIO(类似S3)的环境中正常运作的其他事物

但是,我建议 而不是将您的数据湖存储放入临时容器中

关于hadoop - 在Kubernetes上使用Hadoop,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60390313/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com