gpt4 book ai didi

sql - Spark SQL 会完全取代 Apache Impala 或 Apache Hive 吗?

转载 作者:可可西里 更新时间:2023-11-01 14:20:34 32 4
gpt4 key购买 nike

我需要在我们的服务器上部署大数据集群。但我只知道 Apache Spark 的知识。现在我需要知道 Spark SQL 是否可以完全替代 Apache Impala 或 Apache Hive。

我需要你的帮助。谢谢。

最佳答案

我想用实时场景来解释这一点

实时生产项目:

Hive 主要用于存储数据/表和运行临时查询,如果组织每天都在增加数据并且他们使用 RDBMS 数据进行查询,那么他们可以使用 HIVE。

Impala 用于商业智能项目,其中报告是通过一些前端工具(如 tableau、pentaho 等)完成的。

Spark 主要用于分析目的,开发人员更倾向于统计,因为他们也可以使用带有 spark 的 R 语言来制作他们的初始数据框。

所以对您的问题的回答是“否”,spark 不会取代 hive 或 impala。因为这三个都有自己的用例和优势,而且这些查询引擎的实现难易程度也取决于您的 hadoop 集群设置。

这里有一些链接可以帮助您更清楚地理解:

http://db-engines.com/en/system/Hive%3BImpala%3BSpark+SQL

http://www.infoworld.com/article/3131058/analytics/big-data-face-off-spark-vs-impala-vs-hive-vs-presto.html

https://www.dezyre.com/article/impala-vs-hive-difference-between-sql-on-hadoop-components/180

关于sql - Spark SQL 会完全取代 Apache Impala 或 Apache Hive 吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40236465/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com