gpt4 book ai didi

data-warehouse - 为什么我们应该将维度和事实分开而不是将两者合并在一张表中

转载 作者:行者123 更新时间:2023-12-02 07:27:24 26 4
gpt4 key购买 nike

需要对维度建模或星型模式有所了解。

通常,我们在设计数据仓库时都会有事实表和维度表。

但是,在事实表中嵌入维度确实有意义。特别是对于没有其他属性并且很少更改其值的简单维度。

在事实表中有维度会使查询运行非常快,不需要单独维护维度表,在做ETL时不需要查找维度表。

有没有考虑将维度与事实分开?

最佳答案

  • 事实有很多行。如果您将一个长度为 20 的属性放入事实中,则需要比仅存储 INT 更多的存储空间。代理键(4 个字节)。更多存储=更大的表=降低的性能。
  • 您几乎总是希望针对给定属性存储其他层次结构和属性。即使您现在不这样做,将来您也可能希望这样做
  • 通常在报告中,您会在下拉列表中列出这些属性以供过滤。你如何从事实中得到这些? SELECT DISTINCT在一个非常大的表上,如果没有索引,这是很昂贵的。使用索引,您正在影响您的负载性能。

  • 当你把东西放在维度而不是事实中时,这意味着你已经对它如何适应业务进行了某种分析

    关于data-warehouse - 为什么我们应该将维度和事实分开而不是将两者合并在一张表中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26525113/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com