gpt4 book ai didi

data-warehouse - 具有多个事实表的数据仓库的设计

转载 作者:行者123 更新时间:2023-12-03 13:40:38 25 4
gpt4 key购买 nike

我是数据仓库的新手。首先,我要比将数据仓库工具包的副本精确到邮箱(蜗牛邮件:P)要精确得多。但是我已经在网上找到了所有这些东西。

但是,当您似乎在DW中拥有多个事实时,该怎么办呢?就我而言(保险),我会定期退款。一个客户三个月可以没有一个,然后在同一个月中可以有十个。另一方面,我有“订阅费”(不确定什么是正确的英语术语,但是您明白了),该费用每个月或每三个月发生一次。在我看来,这显然是两个截然不同的事实。

两者在某种程度上是松散耦合的,例如客户或“保险产品”。现在是这两个不同的仓库,我必须在它们上产生两个不同的报告,然后将这些报告连接到DW外部吗?或者有没有一种方法可以设计它以适合单个下降的DW。还是应该将这两个事实合而为一?那我可能会失去退款的粒度。

我读过的一些博客说DW总是有一个事实表。其他人提到了用S设计事实表的步骤,但是并没有明确说明它们之间是否存在链接,或者它们只是同一DW项目的不同组件。

有人知道DW设计的精确部分的一些引用吗?

最佳答案

倒退您的问题。

一个数据仓库可以有多个事实表。但是,您确实希望最小化事实表之间的联接。可以在不同的事实表中复制事实信息。

您提到的对象中:

退款是事实。时间戳是退款事实的维度。

订阅费是事实。时间戳是订阅费用事实的维度。

退款可以多次发生。我猜每个客户都有一笔订阅费。到目前为止,看来我们有两个事实表:客户和客户退款。

如果您知道最多只能进行3次退款(例如),那么您将消除客户退款事实表,并在客户表中放入3个退款列。

您还提到了保险。客户可以有多个保单。因此,我们有第三个事实表。

通常使用star schema设计数据仓库。星型模式基本上是连接到一个或多个维表的一个事实表。由于我们已经定义了3个事实表,因此您在数据仓库中可能会拥有一颗以上的星星。

关于data-warehouse - 具有多个事实表的数据仓库的设计,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3308647/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com