hadoop - 嵌入式模式下的 Spark - 未找到用户/配置单元/仓库-6ren

hadoop - 嵌入式模式下的 Spark - 未找到用户/配置单元/仓库

转载作者：可可西里更新时间：2023-11-01 14:15:56

24

4

我在嵌入式本地模式下使用 Apache Spark。我的 pom.xml 和同一版本(spark-core_2.10、spark-sql_2.10 和 spark-hive_2.10)中包含所有依赖项。

我只想运行一个 HiveQL 查询来创建一个表(存储为 Parquet)。

运行以下(相当简单的)代码:

public class App {
    public static void main(String[] args) throws IOException, ClassNotFoundException {

        SparkConf sparkConf = new SparkConf().setAppName("JavaSparkSQL").setMaster("local[2]").set("spark.executor.memory", "1g");
        JavaSparkContext ctx = new JavaSparkContext(sparkConf);
        HiveContext sqlContext = new org.apache.spark.sql.hive.HiveContext(ctx.sc());

        String createQuery = "CREATE TABLE IF NOT EXISTS Test (id int, name string) STORED AS PARQUET";
        sqlContext.sql(createQuery);
    }
}

...返回以下异常:

FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:file:/user/hive/warehouse/test is not a directory or unable to create one)

我可以在项目的根目录中看到创建的 metastore_db 文件夹。

我四处搜索，找到的解决方案没有帮助——其中大部分不适用于嵌入式模式。

一个解决方案是检查权限，我对所有内容都使用同一个用户。
另一个解决方案是在 HDFS 中手动创建文件夹，我这样做了并且可以导航到/user/hive/warehouse/test。
一种解决方案是通过添加以下内容手动设置 Metastore:sqlContext.sql("SET hive.metastore.warehouse.dir=hdfs://localhost:9000/user/hive/warehouse");.

我现在没有想法了，有人可以提供任何其他建议吗？

最佳答案

以防万一这对将来的其他人有帮助，我正在尝试针对使用 HiveContext 的 Spark 代码编写一些单元测试。我发现为了更改为测试编写文件的路径，我需要调用 hiveContext.setConf。我也尝试了与 OP 相同的方法，执行 SET 查询，但这没有用。以下似乎有效!

hive.setConf("hive.metastore.warehouse.dir", 
  "file:///custom/path/to/hive/warehouse")

为了让它更有用，我专门将此路径设置为我的代码可以访问的位置:

hive.setConf("hive.metastore.warehouse.dir", 
  getClass.getResource(".").toString)

有了这个，我已经能够使用配置单元查询和 Spark API 针对我的代码编写单元测试。

关于hadoop - 嵌入式模式下的 Spark - 未找到用户/配置单元/仓库，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31985728/

24

4

0

文章推荐： c++ - 如何关闭Windows中缓存的预取？

文章推荐： hadoop - Apache hive MSCK REPAIR TABLE 未添加新分区

文章推荐： maven - 如何将 proto3 与 Hadoop/Spark 一起使用？

文章推荐： windows - 如何绕过批处理文件处理限制

ios - 底部标签栏上方的间隙 - 嵌入式 NavigationController + 嵌入式 TableViewController
这个问题困扰了我几天。这是我的相关 Storyboard布局: 我已经将阳光下的每个布局都设置为所有三个 View Controller ，并且仍然得到一个在横幅 View 上方有一个“间隙”的结果
c++ - 嵌入式 web 控件 (IWebBrowser2)，嵌入式 javascript 的 onkeydown 和 onkeyup 不触发
我正在我的 C++ 程序中嵌入一个网页。我遇到的问题是，在嵌入式页面的 javascript 中，我可以捕获 onkeypress，但不会触发 onkeydown 和 onkeyup。如果我在非嵌入
embedded - 嵌入式+实时开发培训建议
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。想改进这个问题？将问题更新为 on-topic对于堆栈溢出。 5年前关闭。 Improve this qu
memory - 嵌入式/内存LDAP服务器解决方案
我有一个 java web 应用程序。我想创建一个嵌入式 LDAP 服务器，当 web 应用程序运行时，我将向 LDAP 插入一些记录，并且有另一个 web 应用程序将访问此 LDAP 以获取信息。可
Maven Tomcat(嵌入式)
我正在尝试通过 tomcat maven 插件将 war 部署到嵌入式 tomcat 服务器。控制台显示服务器启动正常。看来 war 还没有展开。当我访问 http://localhost:9090
python - 嵌入式 if 语句
假设我有如下函数: bigrams=[(k,v) for (k,v) in dict_bigrams.items() if k[:pos_qu]==selection[:pos_qu
Python 嵌入式 C++
我读过一些关于 python 嵌入式 C++ 的教程。我曾引用过 python 对象。 https://docs.python.org/3/c-api/function.html Python 脚本:
c - 在调试符号中显示宏(嵌入式)
我正在使用嵌入式应用程序，在调试期间，调试器无法解析宏符号(我的理论:因为宏在预处理中丢失了)。我最终不得不先在源代码中找到宏，然后使用定义来监视变量。我的问题是:有没有办法将宏定义合并到 elf
c - 如何使用主应用程序和引导加载程序中的一项功能？ (嵌入式)
首先我要说的是我开发的是基于cortex m4的嵌入式设备应用。我有引导加载程序和主应用程序通用的功能。现在我为引导加载程序和应用程序编译源文件 2 次。但是我的双库 dfu 空间不足，我想在 RO
c++ - 链接器如何决定代码执行将从哪里开始？ [嵌入式]
作为嵌入式 C 编程的初学者，我很好奇每个(根据我的经验)程序执行是如何从 main() 函数开始的？这就像链接器识别 main() 并将那个“特殊” 函数的地址放入重置 vector 指向的地址。
algorithm - 快速循环打印十进制数字(嵌入式)
在我的实时嵌入式处理器固件中，我需要十进制数字的格式化打印。标准 printf/sprintf 在工具链中不可用，所以我需要自己实现它。我使用了除以十并取余的天真方法。但是我的目标处理器本身不支持除
java - 嵌入式 if 语句的替代方案？
我有编程经验，但在软件开发方面了解不多。我目前正在为我工作的公司编写一个软件，我开始挑战自己代码的可读性。我想知道这是否是嵌入式 if 语句的“有效”替代方案，或者我是否可以使用更好的方法。假
嵌入式 Linux 中的缓存和非缓存内存访问
我有一个运行嵌入式 Linux 的嵌入式目标，我想计算以下时间: 1) 高速缓存读/写时序2) uncache 内存读/写时序 Linux 中是否有任何标准测试来计算上述时间？我已经编写了自己的测试
嵌入式 Linux 系统的组件
大多数嵌入式设备都是为了在通常资源受限或低规格的设备上执行特定任务而构建的。因此，大多数嵌入式开发人员需要去除不必要的库和模块，并为其特定设备和用例创建自定义分发。我们先来了解一下嵌入式 Linu
c - 嵌入式 c - 如何在程序崩溃时释放分配的内存
我正在嵌入式处理器上编写一个简单的裸机应用程序。作为此应用程序的一部分，它必须使用 malloc 在大约 256kB 的堆上分配一些内存。注意:最初这是在 main 中静态分配的，但在一定的大小限制下
html - 嵌入式 Youtube 视频未填满屏幕
我正在尝试为我 friend 的婚礼建立一个网站。我使用的是 Bootstrap 5，嵌入的视频没有填满屏幕大小。这是一个 live test page HTML: 您还需要代码吗？我想让视频的全宽
c - 嵌入式 GCC 优化魔法
我有一个项目，我尝试为微 Controller 构建固件并尝试更好地控制所使用的优化标志。我想，而不是使用 -O flag 分别指定不同的优化标志。不幸的是，-O 似乎发生了一些优化魔法。我无法使用单
c++ - 如何在不同内核之间正确共享运行时创建的多态数据？嵌入式 C++
我正在使用双核设备，并且要求核心 A 创建一个数据结构，其中包含在核心 B 上运行的函数列表的参数，定期更新它并通知核心 B。参数和类型的数量可以改变在运行期间。我的计划如下.. 创建一个 Para
.net - 嵌入式 WebBrowser 控件拦截水平滚动事件
我们有一个 Microsoft.Phone.Controls.WebBrowser内嵌控件 StackPanel , 在 PivotItem 内在 Windows Phone 8 上。以简化的形式，它
javascript - 嵌入式 js 代码如何在页面上插入表单或其他动态内容？
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 2 年前。 Improve this ques

首页

博学

6Ren·AI

商城

hadoop - 嵌入式模式下的 Spark - 未找到用户/配置单元/仓库