gpt4 book ai didi

data-warehouse - 大维度周期性快照事实表

转载 作者:行者123 更新时间:2023-12-04 02:09:38 26 4
gpt4 key购买 nike

我被要求对星图进行建模。
我有 3 个维度:

  • 日期(日、月、年、周、季度、...)
  • 位置(500 个不同的值)
  • 产品(80k 种不同的产品)

  • 主要问题是一天结束时每个地方存储了多少元素(产品)。

    经过一些关于维度建模的学习时间。我想我应该实现一个 周期快照表 .然而,通过阅读 Kimball Docs,我注意到定期快照需要维度的每个组合的条目。这意味着我应该添加 40M 每天行(80k * 500)。
    知道产品是(真正的)缓慢移动的,而且很多地方都存储 长时间的产品,这听起来像是一种极端的矫枉过正。
    仅供引用,三年后源数据库中的事务为 150k 行。

    那么我真的应该每天添加 40M 行,还是可以只添加指定产品的非空商店?另外,如果某天由于某种原因所有商店都空了,我是否应该为那天输入一个条目(商店和产品的尺寸为 N/A)?

    最佳答案

    你建模正确。这取决于规范,但通常您只存储存在于某个位置的产品(您不存储零),这可能会产生远低于最大 80k 的数字。

    如果你想进一步减少你的数字,你可以存储最后 N 天,然后开始在“冷”表中移动数据。您存储(例如)最近 10 天的快照,然后仅在主“热门”事实表中存储月度快照。

    不要排除在报告系统中动态计算快照的可能性,这取决于您的环境可能很容易(例如在 MDX 或 DAX 中)。混合解决方案也是可能的(即仅动态计算最后一个月)。

    关于data-warehouse - 大维度周期性快照事实表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39890328/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com