- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我的任务是提出有关如何进行 EDW 的建议,并且正在寻求对我所看到的内容的澄清。我所了解的一切都表明,与 Inmon 相比,Kimball 的方法将更快地为业务带来值(value)。我知道 Kimball 的方法是从一开始的维度模型,不同的数据集市(星型模式)通过一致的维度进行集成……因此理论上我可以简单地提出我的直接 DM 来解决业务需求并从那里继续.
我正在学习的内容表明 Inmon 的模型表明我有一个用 3NF 设计的 EDW。 EDW 不是由源系统定义的,而是由业务结构、企业工厂(订单、人力资源等)定义的。所以来自不同系统的数据映射到这个结构中。一旦数据采用这种形式,就会创建 ETL 以生成 DM。
我个人觉得 Inmon 的方法是一个更好的方法。我相信这种方式将确保数据的一致性,并且感觉您可以使用这些数据做更多的事情。阻碍我采用这种方法的是我正在阅读的所有内容都表明交付某些东西需要更多时间,但我不知道这是真的。从我的狭隘观点来看,无论最终结果如何,我们都需要一个 DM。无论使用 Kimball 还是 Inmon 的方法,最终结果都是一样的。
那么问题就变成了我们如何到达那里?在 Kimballs 方法中,我们将创建 ETL 到某个暂存位置,通常从那里创建一个 DM。在 Inmon 的方法中,我觉得我们只是添加了另一层……即从暂存区我们将这些数据加载到按功能组织的 3NF 中的另一个数据库中。我缺少的是这一步如何增加这么多时间。
我觉得我可以看看需要制作的最终DM。将这些映射回 3NF 中的 DW,然后随着更多 DM 的请求,继续使用越来越多的数据构建 3NF 中的 DW。但是,如果我在 Kimballs 模型中创建一个 DM,那么 DM 将围绕为该 DM 决定的粒度级别构建,如果下一个 DM 请求想要以更深的粒度报告怎么办(对我来说,感觉就像 Kimballs 方法需要更多工作)和 Inmon 的没关系。我拥有跨国级别的一切,因此需要不同 Cereal 的 DM,我有数据,只需将其 ETL 到 DM,所有 DM 将报告相同,因为它们来自相同的数据。
我不知道......只是在寻找其他人的观点。我读到的所有内容都说 Kimball 的速度更快……我说肯定可能会有点,但走更快的路线肯定会产生成本。并且为了争论...假设需要一个星期才能启动并运行 Kimballs 方法...对我来说,使用 Inmon 的时间应该只需要 10% 或者 20%。
如果有人对不同模型有任何实际经验,并且如果一个模型真的需要更长的时间,那么另一个模型......请分享。或者,如果我有这个倒退,也告诉我!
最佳答案
对于上下文;我照看一个30亿条记录的数据仓库,为一个大型跨国公司。我们的数据通过分段从各种源系统进入 3NF 数据库。从这里开始,我们的 ELT 流程将数据移动到按维度建模的星型模式数据库中。
如果我可以重新开始,我肯定会放弃 3NF 步骤。当我第一次构建该层时,我认为它会增加真正的值(value)。我确信规范化会保护我的数据的完整性。我同样相信 3NF db 将是运行大型/复杂查询的最佳场所。
但在实践中,它减缓了我们的发展。大多数更改需要更新阶段、3NF 和星型模式数据库。
额外的层还增加了发布数据所需的时间。额外的转换、检查和对账都会加起来。
promise 的诚信改善从未实现。我现在意识到,因为我控制 ETL 和其中的验证过程,所以我可以确保我的数据既非规范化又准确。在报告数据时,我们控制每个表格中的每个单元格。我想得越多,我就越认为这是一个真正的机会。
大而复杂的查询是另一个被经验打破的神话。我现在认为需要编写复杂的报告查询是我的星型数据库的失败。发生这种情况时,我总是问自己:为什么这个问题不容易回答?答案通常是糟糕的表设计。最好在转换数据时进行繁重的工作。
运行 3NF 和 star 也为两个系统产生了分歧的机会。当这种情况发生时,通常是一个非常微妙的差异。两者都没有错,就其本身而言。相反,有可能 3NF 和 star 查询提出的问题略有不同,因此返回不同的结果。尽管在技术上是正确的,但这可能很难解释。随着时间的推移,即使是微小且可解释的差异也会削弱信心。
为我们的 3NF db 辩护,它确实使加载到星中更容易。但我很乐意用更复杂的 SSIS 包换掉一层。
说了这么多;如果没有深入了解他们的系统、要求、文化、技能等,很难向任何人推荐一种方法。阅读您的问题后,我相信您已经解决了所有这些问题,毫无疑问还有更多问题!最后,只有您可以决定最适合您情况的方法。一旦你下定决心,就坚持下去。一致性、清晰度和定义明确的方法比其他任何东西都重要。
关于data-warehouse - EDW Kimball VS Inmon,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41110932/
我是 Mercurial 的新手,并且不知何故仍处于评估过程中,所以这四个概念对我来说有点困惑。有些被提到等同于 Git 的 Staging/Index 概念,有些甚至比 Git 的 Staging
关闭。这个问题需要更多focused .它目前不接受答案。 想改善这个问题吗?更新问题,使其仅关注一个问题 editing this post . 6 个月前关闭。 Improve this ques
任何人都可以给我详细信息吗? 例如? #ID 是属性、特性、选择器还是 anchor ? 默认属性和默认属性是不同的东西吗? 这些都是标签还是元素? 我们将对此说些什么 这个 ..... 还有这些
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 8 年前。 Improve this qu
我有一个由 Javascript 填充的下拉列表。 在决定加载时显示的默认值时,我意识到以下属性显示的值完全相同: innerText innerHTML label text textContent
我可以知道每个 Exec 之间有什么区别吗? , ExecWait , ExecShell , nsExec::Exec , nsExec::ExecToLog, nsExec::ExecToStac
当您处于版本 1 和版本 2 之间时,您会如何维护您的软件? 从我的角度来看,“补丁”、“修补程序”、“维护版本”、“服务包”等术语都很模糊,根据与您交谈的对象不同,定义也不同。 您如何称呼版本之间的
我刚刚发现在 ES6 中有一个新的数学方法:Math.trunc . 我在 MDN article 中阅读了它的描述。 , 听起来像使用 |0 . 此外,>0 , &-1 , ^0也做类似的事情(感谢
我想知道我的 StackPanel 所有项目的高度。 有什么区别: Height - 获取或设置元素的建议高度。 ActualHeight - 获取该元素的渲染高度。 (只读) ExtentHeigh
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 9 年前。 Improve this
我对所有声称以某种方式阻止计算的内置 Mathematica 函数感到困惑:Unevaluated、Defer、Hold ,以及超过 6 个 Hold* 形式。 Mathematica 文档只是单独解
我什至不确定正确的术语,所以让我从我的目标开始:拥有一个简单的应用程序(“Data Doler”),它只会将大量数据从文件读取到内存中,然后提供服务将该数据切片到名为“Data Lapper”的单个多
我刚刚开始在我的项目中使用 Elasticsearch,我想像 sql 关键字一样搜索 '喜欢%' 做。 谁能解释一下 之间的区别通配符 , 前缀 , 查询字符串和 正则表达式 ? 哪个可以搜索最好性
由于我对任何主流浏览器(Firefox、Chrome、Opera)都不太满意,而且我尝试过的不太受欢迎的浏览器(近十几种)都没有,所以我决定 DIY 并制作一个网页我想要最好的浏览器。 主要目标是让它
我知道如何使用 Python 解析页面。我的问题是哪种方法是所有解析技术中最快的,其他方法的速度有多快? 我知道的解析技术有Xpath、DOM、BeautifulSoup,还有使用Python的fin
我试图从正在解析的命令行中找出哪个函数最适合将十进制、十六进制或八进制数转换为 int 最好——在不知道输入的情况下事先。 目标是使用一个函数来识别不同类型的输入并将其分配给它的整数 (int) 值,
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
我们需要在我们的网站上显示酒吧、餐馆和剧院等各种场所的元信息(例如,地址、姓名)。 理想情况下,用户会输入地点名称以及邮政编码,我们会提供最接近的匹配项。 人们将哪些 API 用于类似的地理定位目的?
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
我正在创建我的第一个 Web 应用程序,我真的很困惑应该使用什么技术。 我的应用程序需要看起来很严肃(像一个应用程序),它不需要很多色彩缤纷的图形界面。它只需要一个工具栏、一个标签栏、一个拆分面板(最
我是一名优秀的程序员,十分优秀!