gpt4 book ai didi

hadoop - Spark 看不到 Hive 外部表

转载 作者:可可西里 更新时间:2023-11-01 16:22:34 25 4
gpt4 key购买 nike

我是 Spark 和 AWS 的菜鸟。

我在 AWS 中有一个 DynamoDB 表。我使用 Hive 在 EMR 上创建了一个 Spark 集群。使用 Hive Shell,我创建了外部表“RawData”以连接到 DynamoDB。

现在,当我使用 DynamoDB 依赖项 jar 启动 spark-shell --jars/usr/share/aws/emr/ddb/lib/emr-ddb-hive.jar,/usr/share/aws/emr/ddb/lib/emr-ddb-hadoop.jar我可以使用 HiveContext 查询表“RawData”并得到结果。 但是当我使用 spark-submit 提交我的 Spark 程序时,我在终端中看到了一些 spark 异常,并且在我发现的日志中:“org.apache.spark.sql.AnalysisException:没有这样的表 RawData”。

这就是我创建集群的方式:aws emr create-cluster --name MyCluster --release-label emr-4.0.0 --applications Name=Spark Name=Hive ...

请指教我做错了什么。列夫

最佳答案

我发现了提交命令中缺少的内容。我必须添加 --files/etc/hive/conf/hive-site.xml 作为 spark-submit 的参数之一。

关于hadoop - Spark 看不到 Hive 外部表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31994630/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com