gpt4 book ai didi

apache - Apache Tajo 和 Apache hive 之间的实际区别是什么

转载 作者:可可西里 更新时间:2023-11-01 16:06:09 26 4
gpt4 key购买 nike

最近,Apache Tajo 项目 正在开发中。该项目的目标是“Hadoop 中用于处理网络规模数据集的高级开源数据仓库系统”

既然我们已经将 Apache hive 作为 hadoop 的数据仓库,并且现在已经很先进并被广泛使用,这个新项目对 hadoop 世界有多大用处和不同之处?

最佳答案

如果您已经在 Hive 上建立了稳定的仓库,我敢肯定您在短期内不必搬走。 Tajo 尝试访问的几个区域是:

  1. 低延迟查询(即席):您可能会使用 Impala/Tez 获得足够快的结果,而 hive-on-spark 随 CDH 5.7 一起提供。为了获得更快的响应,可以使用不同的数据库(通常不是 DWH)。
  2. 完整的 SQL 支持:只要使用 Hive 的人已经熟悉 HQL,就没有迫切需要 SQL。虽然您可以很容易地理解为什么拥有完整的 SQL 支持是一个好处。

关于apache - Apache Tajo 和 Apache hive 之间的实际区别是什么,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36581752/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com