gpt4 book ai didi

hadoop - 使用什么.. HDFS 上的 Impala 或 Hbase 上的 Impala 或只是 Hbase?

转载 作者:可可西里 更新时间:2023-11-01 14:22:08 28 4
gpt4 key购买 nike

我正在处理概念验证任务。任务是使用 Hadoop 技术实现我们产品的一项功能。

功能非常简单,我们有一个 UI,可让您插入有关“网络问题”的详细信息。有关此类问题的所有详细信息都被捕获并插入到 Oracle 数据库中的表中。然后,我们处理此表中的数据并计算健康评分。

我必须使用 Hadoop 而不是传统的 Db 所以我的问题是要做什么?HDFS 上的黑斑羚?要么Hbase 上的黑斑羚?要么Hbase?

我正在使用 cloudera VM 进行 POC 实现。

按照我的理解,Hbase是NoSQL分布式数据库,其实是HDFS之上的一层,提供java API来访问数据。Impala 是一种工具,它还提供 JDBC 访问以通过 Hbase 或直接通过 HDFS 访问数据。我是 hadoop 的新手,有人可以帮忙吗?

最佳答案

好吧,这取决于几件事,比如您要执行的处理类型、所需的响应时间等。但是通过查看您在此处编写的内容,HBase 似乎没问题。到目前为止,我还没有发现任何需要 Impala 的地方。 HBase API 很好,可以满足您的大部分需求。

恕我直言,最好在一开始就保持简单,只有在确实需要时才添加工具。同样适用于此。如果您发现 HBase API 无法满足您的目的,您绝对可以将 Impala 添加到您的堆栈中。

话虽这么说,但您应该牢记一件事。 HBase 是一个 NoSQL 数据库,不遵循 RDBMS 约定和术语。所以,一开始你可能会觉得有点奇怪。最好记住这一点然后继续,因为您必须以一种完全不同于 RDBMS 模式设计风格的方式设计模式。

关于hadoop - 使用什么.. HDFS 上的 Impala 或 Hbase 上的 Impala 或只是 Hbase?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17541226/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com