gpt4 book ai didi

hive - 在没有 Hadoop/HDFS 的情况下使用 hive Metastore 服务

转载 作者:行者123 更新时间:2023-12-02 01:20:03 25 4
gpt4 key购买 nike

我知道这个问题有点奇怪。我喜欢 Hadoop 和 HDFS,但最近在使用 Hive Metastore 研究 SparkSQL。

我想使用 SparkSQL 作为垂直 SQL 引擎来跨不同的数据源(如 RDB、Mongo、Elastic ……)运行 OLAP 查询,而无需 ETL 过程。然后我使用相应的 Hive 存储处理程序在 Metastore 中将不同的架构注册为外部表。

此外,我的工作中没有使用 HDFS 作为数据源。然后,给定 Map/R 已经被 Spark 引擎取代。对我来说,Hadoop/HDFS 是无用的,但它是 Hive 安装的基础。我不想全部买。

我想知道如果我只启动Hive Metastore服务而没有Hadoop/HDFS支持SparkSQL,会出现什么样的问题。我会把自己置身于丛林中吗?

最佳答案

您需要的是 "Hive Local Mode"(在页面中搜索“Hive、Map-Reduce 和 Local-Mode”)。

this 也可能有帮助。

仅当您在本地进行试验时才建议使用此配置。但在这种情况下,您只需要 Metastore。

也来自 here

Spark SQL uses Hive Metastore, even if when we don't configure it to . When not configured it uses a default Derby DB as metastore.



所以这似乎是相当合法的;
  • 在 Hive 中安排您的 Metastore
  • 以本地模式启动 Hive
  • 并使 Spark 使用 Hive Metastore
  • 使用 Spark 作为 Hive 支持的所有数据源的 SQL 引擎。
  • 关于hive - 在没有 Hadoop/HDFS 的情况下使用 hive Metastore 服务,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40636593/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com