gpt4 book ai didi

hadoop - 大数据仓库还需要星型模式吗?

转载 作者:可可西里 更新时间:2023-11-01 14:15:04 26 4
gpt4 key购买 nike

我正在使用 hive 设计一个新的基于 hadoop 的数据仓库,我想知道经典的星型/雪花模式在这种情况下是否仍然是“标准”。

大数据系统包含冗余,因此完全规范化的模式通常性能不佳(例如,在像 HBase 或 Cassandra 这样的 NoSQL 数据库中)。

仍然是使用 hive 构建星型数据仓库的最佳实践吗?

通过利用新的列式文件格式来设计行宽(冗余)表是否更好?

最佳答案

在设计 NoSQL 数据库时,您倾向于通过预处理部分查询来针对特定查询进行优化,从而存储数据的非规范化副本(尽管以特定于查询的方式进行非规范化)。

另一方面,星型模式是一种通常适用的通用非规范化。

当您计划使用 hive 时,您实际上并不是将其用于优化,而是用于 SQL 的通用性(?),因此,我认为星型模式仍然合适。但是,对于具有非 SQL 接口(interface)的 NoSQL 数据库,我建议您使用更特定于查询的设计。

关于hadoop - 大数据仓库还需要星型模式吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30824047/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com