gpt4 book ai didi

hadoop - 有关使用Hive和 “(CDH 4.2.0), yarn (Hadoop 2.4.0)”构建Spark的信息?

转载 作者:行者123 更新时间:2023-12-02 21:22:45 24 4
gpt4 key购买 nike

我打算构建Spark以在EC2上分拆。默认的spark_ec2.py下载了一个预先构建的软件包(对于Hadoop 1.0.4,为1;对于CDH 4.2.0, yarn (Hadoop 2.4.0),为2),但该软件包没有'-Phive -Phive-thriftserver'选项。通常,我需要使用Hive UDF,并且必须从源代码构建它。 (我也需要YARN,因为“Hive on Spark在默认情况下支持YARN模式下的Spark”。)

“Building Spark”页面显示了许多示例,似乎混合了以下内容

带有MapReduce v1的Cloudera CDH 4.2.0
mvn -Dhadoop.version=2.0.0-mr1-cdh4.2.0 -Phadoop-1 -DskipTests clean package


具有Hive 13支持的Apache Hadoop 2.4.X
mvn -Pyarn -Phadoop-2.4 -Dhadoop.version=2.4.0 -Phive -Phive-thriftserver -DskipTests clean package
(来源:http://spark.apache.org/docs/latest/building-spark.html)

目前,以下是我能想到的
mvn -Pyarn -Dhadoop.version=2.4.0-mr1-cdh4.2.0 -Phadoop-1 -Phive -Phive-thriftserver -DskipTests clean package
谁能告知以上内容是否正确,或者让我知道可以从中学习的其他资源?

谢谢。

最佳答案

我被误解为--hadoop-major-version具有3个选项:

Hadoop 1.0.4的

  • “1”
  • CDH 4.2.0(mr1)的
  • “2”
    Hadoop 2.4.0的
  • “yarn”

  • 我使用了 spark.ami.hvm.v14 (ami-35b1885c)并能够通过以下方式成功构建。
    ./make-distribution.sh --name spark-1.6.0-bin-hadoop2.4-hive-yarn --tgz -Pyarn -Phadoop-2.4 -Dhadoop.version=2.4.0 -Psparkr -Phive -Phive-thriftserver -DskipTests

    关于hadoop - 有关使用Hive和 “(CDH 4.2.0), yarn (Hadoop 2.4.0)”构建Spark的信息?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36877955/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com