- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我对大数据架构还很陌生,所以请不要对我太苛刻。
我正在尝试找出构建能够处理大量数据的 BI 架构的最佳替代方案。正如我所看到的,解决方案必须是集群/水平可扩展的,以应对系统的增长。我希望能够使用 SQL 与系统进行交互,因此 HBase + Hive(或者甚至是 Pig,不是用于 sql 但不需要手动编写 MR 任务)可能是一个解决方案。与例如 Exasolution 及其 In-Memory - MPP - Columnar 解决方案相比,这种架构的优点/缺点是什么。
还有其他可能有一些额外好处的选择吗?维护和配置呢?任何 Microsoft 解决方案(我可能会发现与此相关的客户特定需求)
很抱歉发布这样一个悬而未决的问题,但我希望看到一些讨论,以便我可以尽可能多地向您学习。
最佳答案
虽然我是 EXASOL 的一员,但我不会开始试图说服您 EXASOL 是唯一的好解决方案。这在很大程度上取决于您尝试实现的用例以及您必须满足的要求。
Hadoop 是一个非常灵活、可扩展的系统,经常用于存储和处理大量数据。
相比之下,EXASOL 是一种专门用于复杂分析查询处理的 RDBMS。
我认为这两个选项并没有真正直接竞争,而是相互补充。在许多情况下,公司需要一个可扩展的数据湖来存储和预处理数据,或者以相当简单的方式查询数据。一旦您想进入具有复杂分析的实时业务,其中有数十、数百甚至数千名分析师正在运行大量查询,那么内存 RDBMS 是一个不错的选择。
King 是 Candy Crush 的制作人,将这两个世界结合到一个强大的数据管理生态系统。他们在 Hadoop 中存储数 PB 的数据,并在顶部使用 EXASOL 作为存储数百 TB 数据的内存层。您可以在此处阅读有关该激动人心的用例的更多信息: http://bit.ly/1TR8APY
这两个世界的另一个重要区别是复杂性。虽然 EXASOL 是免调整的,因为它是一个专门的系统(类似于设备),用于运行 SQL 查询或 R/Python/Java 数据库内分析的特定用例,但 Hadoop 堆栈要复杂得多。您需要一定程度的知识来设置、维护和调整该系统。这不需要成为这两个选项中任何一个的原因。如前所述,这在很大程度上取决于您想要什么。
从价格的角度,Hadoop 是免费的,因此它应该比 EXASOL 等内存数据库便宜得多,对吧?等一下,没那么容易。同样,您必须考虑全局。您真正想要存储多少数据,其中有多少需要查询以进行分析,您需要购买多少硬件,您需要雇用和培训多少人来操作或部署在系统上的分析.
总结
总结一下我的想法,世界太复杂了,无法直接比较这两种技术。根据用例和您的个人要求,其中一个可能是更好的选择。在我看来,市场趋势是将此类系统结合到一个数据管理生态系统中,您可以在其中充分利用两个世界……实际上是三个世界,因为 NoSQL 解决方案的运营数据处理世界也应该是这里提到。
希望对您有所帮助。如果您需要任何进一步的详细信息,尤其是关于 EXASOL 的信息,请随时与我联系或在 LinkedIn 上与我联系:de.linkedin.com/in/exagolo
关于hadoop - Exasol 与 HBase,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31960209/
在 Exasol 数据库中,我们想知道每一行最后一次更改的时间。 其他 DMBS 提供诸如运行任意函数的钩子(Hook)/触发器之类的东西,甚至是 ON UPDATE 语句。搜索这些术语时,我找不到任
我对大数据架构还很陌生,所以请不要对我太苛刻。 我正在尝试找出构建能够处理大量数据的 BI 架构的最佳替代方案。正如我所看到的,解决方案必须是集群/水平可扩展的,以应对系统的增长。我希望能够使用 SQ
我们正在使用内存数据库 Exasol,它确实提供了 Ado.Net 提供程序,但它似乎缺少一些重要的功能,如 ConnectionPooling,因此每个连接根据请求创建和销毁,这会影响我们的性能,因
我想在 EXAsol 中使用 Join 从表中删除一些记录。 我在努力- Delete tran FROM Transactions tran INNER JOIN Employees e ON tr
我们在 Web 应用程序中将 Hibernate 与 Exasol 结合使用。当我们将 Hibernate 的 hibernate.connection.pool_size 属性设置为大于 1 的值(
当使用pyexasol's时对于具有日期时间列的 DataFrame df,Exasol (6.2) 会抛出错误,因为它无法解析 ISO 格式的字符串表示形式数据框列。具体来说,Exasol 无法解析
我目前面临将使用 Spring Data JPA 和 Hibernate 的现有应用程序从 Oracle 数据库迁移到 EXASOL 的问题。这通常应该不是一个大问题,但似乎不可能将 Hibernat
我是一名优秀的程序员,十分优秀!