gpt4 book ai didi

database-design - 合并来自不同来源的事实?还是单独加载?

转载 作者:行者123 更新时间:2023-12-04 07:11:42 24 4
gpt4 key购买 nike

我们有两个不同来源的数据:一些来自客户,一些来自不同的供应商。目前,我们将这些数据物理地“合并”到一个巨大的表中,该表有近百列、数万行并且二维没有正式分离。因此,我们实际上不能将此表用于太多。

我将把这个困惑重新设计成一个适当但很小的星型模式。

这两个维度是显而易见的。例如,其中之一是时间。

客户提供的数据提供了许多事实值。每个供应商可能(也可能不会)提供适合相同维度的额外事实值。

这些事实数据都具有相同的粒度。它可以被称为“稀疏”,因为我们并不经常从所有供应商那里获得信息。

这是我的困境。

这是一个事实表——有一些空值——是从不同的来源填充的吗?

或者这是 n+1 个事实表——一个由客户填充,另一个由每个供应商填充?

每种设计都有利有弊。关于“合并”或“单独加载”之间的选择,我需要一些第二意见。


客户提供收入、成本、数量、重量以及他们知道的有关交易结束的其他信息。

供应商一提供了一些关于某些交易的额外细节——重量、成本、持续时间。其他交易将没有来自供应商一的值(value)。

供应商 2 提供了一些关于某些交易的额外详细信息——数量、持续时间、长度、外币汇率。其他交易对供应商二没有值(value)。

有些交易会有两个供应商。一些交易将没有供应商。

一张表有空值?三张 table ?

最佳答案

我会选择单一事实表。这种方法的亮点在于它将所有艰苦的工作都留在了加载时而不是查询时。

关于database-design - 合并来自不同来源的事实?还是单独加载?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/227990/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com