hadoop - Exasol 与 HBase-6ren

hadoop - Exasol 与 HBase

转载作者：可可西里更新时间：2023-11-01 16:52:20

28

4

我对大数据架构还很陌生，所以请不要对我太苛刻。

我正在尝试找出构建能够处理大量数据的 BI 架构的最佳替代方案。正如我所看到的，解决方案必须是集群/水平可扩展的，以应对系统的增长。我希望能够使用 SQL 与系统进行交互，因此 HBase + Hive(或者甚至是 Pig，不是用于 sql 但不需要手动编写 MR 任务)可能是一个解决方案。与例如 Exasolution 及其 In-Memory - MPP - Columnar 解决方案相比，这种架构的优点/缺点是什么。

还有其他可能有一些额外好处的选择吗？维护和配置呢？任何 Microsoft 解决方案(我可能会发现与此相关的客户特定需求)

很抱歉发布这样一个悬而未决的问题，但我希望看到一些讨论，以便我可以尽可能多地向您学习。

最佳答案

虽然我是 EXASOL 的一员，但我不会开始试图说服您 EXASOL 是唯一的好解决方案。这在很大程度上取决于您尝试实现的用例以及您必须满足的要求。

Hadoop 是一个非常灵活、可扩展的系统，经常用于存储和处理大量数据。

相比之下，

EXASOL 是一种专门用于复杂分析查询处理的 RDBMS。

我认为这两个选项并没有真正直接竞争，而是相互补充。在许多情况下，公司需要一个可扩展的数据湖来存储和预处理数据，或者以相当简单的方式查询数据。一旦您想进入具有复杂分析的实时业务，其中有数十、数百甚至数千名分析师正在运行大量查询，那么内存 RDBMS 是一个不错的选择。

King 是 Candy Crush 的制作人，将这两个世界结合到一个强大的数据管理生态系统。他们在 Hadoop 中存储数 PB 的数据，并在顶部使用 EXASOL 作为存储数百 TB 数据的内存层。您可以在此处阅读有关该激动人心的用例的更多信息: http://bit.ly/1TR8APY

这两个世界的另一个重要区别是复杂性。虽然 EXASOL 是免调整的，因为它是一个专门的系统(类似于设备)，用于运行 SQL 查询或 R/Python/Java 数据库内分析的特定用例，但 Hadoop 堆栈要复杂得多。您需要一定程度的知识来设置、维护和调整该系统。这不需要成为这两个选项中任何一个的原因。如前所述，这在很大程度上取决于您想要什么。

从价格的角度，Hadoop 是免费的，因此它应该比 EXASOL 等内存数据库便宜得多，对吧？等一下，没那么容易。同样，您必须考虑全局。您真正想要存储多少数据，其中有多少需要查询以进行分析，您需要购买多少硬件，您需要雇用和培训多少人来操作或部署在系统上的分析.

总结

总结一下我的想法，世界太复杂了，无法直接比较这两种技术。根据用例和您的个人要求，其中一个可能是更好的选择。在我看来，市场趋势是将此类系统结合到一个数据管理生态系统中，您可以在其中充分利用两个世界……实际上是三个世界，因为 NoSQL 解决方案的运营数据处理世界也应该是这里提到。

希望对您有所帮助。如果您需要任何进一步的详细信息，尤其是关于 EXASOL 的信息，请随时与我联系或在 LinkedIn 上与我联系:de.linkedin.com/in/exagolo

关于hadoop - Exasol 与 HBase，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31960209/

28

4

0

文章推荐： c++ - C程序执行速度

文章推荐： java - 在 Java 中为 HTTP 调用处理大文件

文章推荐： c++ - 返回未知类型的函数

database - Exasol 数据库中最后一次修改的跟踪时间
在 Exasol 数据库中，我们想知道每一行最后一次更改的时间。其他 DMBS 提供诸如运行任意函数的钩子(Hook)/触发器之类的东西，甚至是 ON UPDATE 语句。搜索这些术语时，我找不到任
hadoop - Exasol 与 HBase
我对大数据架构还很陌生，所以请不要对我太苛刻。我正在尝试找出构建能够处理大量数据的 BI 架构的最佳替代方案。正如我所看到的，解决方案必须是集群/水平可扩展的，以应对系统的增长。我希望能够使用 SQ
c# - Exasol Ado.Net 提供商的自定义连接池
我们正在使用内存数据库 Exasol，它确实提供了 Ado.Net 提供程序，但它似乎缺少一些重要的功能，如 ConnectionPooling，因此每个连接根据请求创建和销毁，这会影响我们的性能，因
sql - 如何使用 Join EXASol 删除
我想在 EXAsol 中使用 Join 从表中删除一些记录。我在努力- Delete tran FROM Transactions tran INNER JOIN Employees e ON tr
java - 如何在 Exasol 上启用 JDBC 连接池？
我们在 Web 应用程序中将 Hibernate 与 Exasol 结合使用。当我们将 Hibernate 的 hibernate.connection.pool_size 属性设置为大于 1 的值(
python - ISO 格式的 Pandas 时间戳在导入时导致 Exasol 错误
当使用pyexasol's时对于具有日期时间列的 DataFrame df，Exasol (6.2) 会抛出错误，因为它无法解析 ISO 格式的字符串表示形式数据框列。具体来说，Exasol 无法解析
java - Spring Data JPA、Hibernate 和 EXASOL 数据库
我目前面临将使用 Spring Data JPA 和 Hibernate 的现有应用程序从 Oracle 数据库迁移到 EXASOL 的问题。这通常应该不是一个大问题，但似乎不可能将 Hibernat

首页

博学

6Ren·AI

商城

hadoop - Exasol 与 HBase