gpt4 book ai didi

hive - hive 、黑斑羚和直线之间的区别

转载 作者:行者123 更新时间:2023-12-03 23:38:16 28 4
gpt4 key购买 nike

我是 Hadoop 生态系统工具的新手。
任何人都可以帮助我了解 hive 、直线和 hive 之间的区别。

提前致谢!

最佳答案

Apache hive :

1] Apache Hive 是一个建立在 Hadoop 平台上的数据仓库基础设施,用于执行数据密集型任务,例如查询、分析、处理和可视化。
2] Hive 在编译时生成查询表达式。
3]每个Hive查询都有这个“冷启动”的问题
4] Hive 在涉及开销的引擎盖下将要执行的查询转换为 MapReduce 作业。
5] Hive 是更通用、通用和可插拔的语言。
6] 对于兼容性和速度同样重要的升级项目。 hive 是一个理想的选择。

Cloudera Impala :

1] Impala 是程序员在 HDFS 和 Apache HBase 上运行查询的绝佳选择,因为它不需要移动或转换数据。
2] Impala 使用 llvm 为“大循环”生成运行时代码。
3] Impala 避免了启动开销,因为守护进程在启动时启动,总是准备好处理查询。
4] Impala 通过大规模并行处理快速响应。
5] Impala 用于释放其强大的处理能力并提供闪电般的快速分析结果。
6] Impala 是开始新项目时的理想选择。

直线:

1] Hive CLI 直接连接到 Hive 驱动程序,并要求 Hive 与客户端安装在同一台机器上。
2] 但是,Beeline 连接到 HiveServer2 并且不需要在与客户端相同的机器上安装 Hive 库。
3] Beeline 是一个瘦客户端,它也使用 Hive JDBC 驱动程序,但通过 HiveServer2 执行查询,它允许多个并发客户端连接并支持身份验证。
4] Cloudera 的 Sentry 安全性通过 HiveServer2 而不是 Hive CLI 使用的 HiveServer1 工作。因此 hive 虽然命令行不会遵循 Setry 的策略。根据 cloudera 文档,您不应使用 Hive CLI 和 WebHCat。使用 beeline 或 impala-sell 代替。
5] 与直线联系: url 是 jdbc 连接字符串,指向 hiveServer2 主机。
终端> beeline -u url -n 用户名 -p 密码

终端> 直线
直线> !connect jdbc:hive2://HiveServer2Host:Port

关于hive - hive 、黑斑羚和直线之间的区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41183373/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com