gpt4 book ai didi

hadoop - Pig Hive Hbase 之间有何不同

转载 作者:可可西里 更新时间:2023-11-01 16:57:49 26 4
gpt4 key购买 nike

我是 hadoop 技术的新手。我想弄清楚这些 Pig Hive 和 Hbase 用于哪种类型的数据(结构化、非结构化、semo 结构化)?

在哪种情况下使用哪种工具最有效?

最佳答案

您应该从阅读最基本的 Hadoop 文档开始:http://hadoop.apache.org/#What+Is+Apache+Hadoop%3F

然后,您可以在每个项目站点上找到最佳解释:


Apache Pig 是一个用于分析大型数据集的平台,由用于表达数据分析程序的高级语言以及用于评估这些程序的基础架构组成。 Pig 程序的显着特性是它们的结构适合大量并行化,这反过来又使它们能够处理非常大的数据集。

http://pig.apache.org/


Apache Hive™ 数据仓库软件有助于查询和管理驻留在分布式存储中的大型数据集。 Hive 提供了一种机制,可以将结构转换到此数据上,并使用称为 HiveQL 的类似 SQL 的语言查询数据。同时,当在 HiveQL 中表达这种逻辑不方便或效率低下时,这种语言还允许传统的 map/reduce 程序员插入他们的自定义映射器和缩减器。

http://hive.apache.org/


当您需要对大数据进行随机、实时读/写访问时,请使用 Apache HBase。该项目的目标是在商用硬件集群上托管非常大的表——数十亿行 X 数百万列。 Apache HBase 是一个开源的、分布式的、版本化的、非关系型数据库,它模仿 Google 的 Bigtable:Chang 等人的结构化数据的分布式存储系统。正如 Bigtable 利用 Google 文件系统提供的分布式数据存储一样,Apache HBase 在 Hadoop 和 HDFS 之上提供类似 Bigtable 的功能。

http://hbase.apache.org/

关于hadoop - Pig Hive Hbase 之间有何不同,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27778594/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com