gpt4 book ai didi

database - 数据仓库注意事项 : When and Why?

转载 作者:太空狗 更新时间:2023-10-30 01:37:56 25 4
gpt4 key购买 nike

关闭。这个问题是opinion-based .它目前不接受答案。












想改善这个问题吗?更新问题,以便可以通过 editing this post 用事实和引文回答问题.

4 个月前关闭。




Improve this question




这里有一点背景:

我知道 what a data warehouse is , 或多或少。我已经阅读了几十本关于数据仓库的指南,我玩过 SSAS,我知道什么是星型模式、维度表和事实表,我知道 ETL 是什么以及如何去做。 这不是“如何”问题或教程请求。

我的问题是,我读过的关于数据仓库的所有 Material 似乎都掩盖了构建数据仓库的基本原理。它们都是比喻性的,或者在某些情况下从字面意思开始,“所以你决定建立一个数据仓库......”但我还没有做出那个决定。

所以我希望 SO 成员可以向我指出或帮助提出某种半客观测试。我可以适应特定系统并最终得到“是的,我们需要一个数据仓库”或“不,今天的返回太小”的东西。我认为我应该能够回答的具体问题是:

  • 在什么时候构建数据仓库是值得考虑的选择?换句话说,我应该注意哪些可能表明标准事务环境不再足够的迹象、指标或其他标准?
  • 完整的数据仓库有哪些替代方案?事务数据库中的非规范化和沼泽标准复制的“报告服务器”是两个想到的;在加入 DW 之前,我还应该探索其他任何东西吗?
  • 为什么数据仓库比上述替代方案更好?如果答案是“取决于”,那么它取决于什么?
  • 不应该我试图建立一个数据仓库?无论上下文如何,我都对任何宣称为“最佳实践”的事情持怀疑态度。当然,在某些情况下,DW 是错误的选择——它们是什么?
  • 有没有实用 我可以查看通过引入数据仓库而改进的系统的示例?可以向我解释,端到端,他们需要仓库进行什么样的决策或分析,他们如何决定将什么放入其中,以及仓库最终如何适应更大的环境?我不想要人为的“让我们用 AdventureWorks 数据库制作一个立方体” - 实现与我无关,我对所涉及的规范和设计以及整体思维过程感兴趣。

  • 我一般尽量不问多方,但我认为这些都是非常密切相关的。我愿意接受至少解决前 4 个问题的任何答案,尽管最后一个确实有助于在我的脑海中明确这一点。如果有人已经写过相关链接,只要它们相当简洁和具体(链接到 Ralph Kimball 的主页 = 没有帮助)就可以了。

    希望我已经把问题说清楚了 - 提前感谢您的回答!

    最佳答案

    我会看看我是否能尽量简洁地回答你的问题。

    1.At what point is building a data warehouse an option worth considering? In other words, what telltale signs, metrics, or other criteria should I be looking out for that might indicate that a standard transactional environment is no longer sufficient?



    一种。如果您发现报告和监控正在损害您的生产系统和/或离线数据存储的性能。

    湾如果您发现要获得业务问题的答案,每次都需要构建大量复杂的 SQL。

    C。如果您发现每次对事务架构进行更改时,都必须返回并重新处理所有报告查询。

    d.如果您想汇集来自多个来源的数据。

    2.What are the alternatives to a full-on data warehouse? Denormalization in the transactional database and the bog-standard replicated "report server" are two that come to mind; are there any others I should explore before committing to the DW?

    3.Why is a data warehouse better than said alternatives? If the answer is, "it depends", then what does it depend on?



    这些我会一一解答。我不会认为数据仓库是一种全有或全无的冒险。这只是一个简洁的短语,意思是“以一种让您更轻松、更快速地回答业务问题的方式存储您的数据”。

    事务数据库旨在有效地与应用程序交互。如果有意义的话,数据仓库、数据集市、运营数据存储和报告表旨在有效地与人交互。

    4.When shouldn't I attempt to build a data warehouse? I'm skeptical of anything declared as a "best practice" irrespective of context. Surely there must be some scenarios where a DW is the wrong choice - what are they?



    好问题。如果您的交易系统为您提供了对业务的充分洞察,那么您可能不需要仓储。

    如果您只有一个数据源并且性能不成问题,您可能可以通过创建简单的报告表获得洞察力。

    5.Are there any practical examples I could look at of systems that were improved by introducing a data warehouse? Something that would explain to me, end-to-end, what sorts of decisions or analysis they needed the warehouse for, how they decided what to put in it, and how the warehouse ended up fitting into the larger environment? I don't want a contrived "let's make a cube out of the AdventureWorks database" - the implementation is irrelevant to me, I'm interested in the specifications and designs and overall thought process that were involved.



    这是一个很大的问题,比我在这里分配的空间要多得多。

    在这一点上,我可以向您指出一些可能提供您所寻求的洞察力的地方。
  • Bruce Ullrey 所著的“实现数据仓库:一种有效的方法论”是一本书,记录了一个人构建数据仓库的历程。它没有高度抛光,这使它更加真实。它读起来就像一本日记,里面有很多模型和其他视觉效果,很好地说明了他的努力。
  • Larissa Moss 的“商业智能路线图”。标准票价。引导您完成构建高级别 BI 实践的过程。
  • 史蒂夫威廉姆斯的“商业智能的利润影响”给出了许多案例研究,展示了构建数据仓库的值(value)。
  • 关于database - 数据仓库注意事项 : When and Why?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1992609/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com