gpt4 book ai didi

database-design - 在设计数据仓库时使用登台数据库的好处

转载 作者:行者123 更新时间:2023-12-03 15:15:55 24 4
gpt4 key购买 nike

我正在设计数据仓库体系结构。
在探索从生产中提取数据并将其放入数据仓库的各种选项时,我遇到了许多文章,这些文章主要建议采用以下两种方法:



生产数据库---->数据仓库(星型模式)----> OLAP Cube
生产数据库---->登台数据库---->数据仓库(星型架构)----> OLAP多维数据集



我仍然不确定哪种方法在性能和减少生产数据库上的处理负载方面是更好的方法。

您在设计数据仓库时发现哪种方法更好?

最佳答案

以下几点摘自DWBI Organization's文章

如果您具有以下任何一种情况,则可能需要临时区域:


增量加载:您的数据是从源中增量读取的,您需要一个中间存储器,可以在其中临时存储增量数据集以进行转换
转换需求:在使用仓库中的数据之前,需要执行数据清理,验证等工作
解耦:您的处理过程要花费大量时间,并且您不想在整个处理过程中保持与源系统的连接(假定实际业务用户一直在使用源系统),因此,您更愿意只需一次从源系统读取数据,断开与源的连接,然后继续在“自己的一侧”处理数据
调试目的:您不必一直回到源头,并且可以仅从暂存区域解决问题(如果有)
故障恢复:源系统可能是暂时的,数据状态可能正在更改。如果遇到任何上游故障,由于此时源已更改,您可能无法重新提取数据。拥有本地副本会有所帮助


性能和减少的处理可能不仅仅是考虑因素。添加阶段有时可能会增加latency(即,从业务事件发生到报告之间的时间延迟)。但我希望以上几点可以帮助您做出更好的判断。

关于database-design - 在设计数据仓库时使用登台数据库的好处,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21010045/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com