- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我即将创建一个包含星型架构中的事实和维度的数据仓库。
我想回答的业务问题通常是:
第一季度,我们向居住在纽约的 30-35 岁女性销售了多少钱?
去年我们的同类服装卖了多少钱?
我正在考虑一个小时粒度的日期维度(指定年、月、日、小时、季度、日期名称、月份名称等)我也在考虑产品维度和用户维度。
我想知道这些问题是否可以使用单个事实表来回答,或者创建多个事实表是否合适?我正在考虑一个表格,例如:
事实销售
DimDate - 转至包含日期信息的表格(例如季度、星期几、年、月、日)
DimProduct - fk 到包含产品信息的表,例如(产品名称)
DimUser - fk 到包含用户信息的表,例如(年龄、性别)
TotalSales - 特定日期、产品和用户的所有销售额的总和。
另外,如果我想测量摊位的总销售额(金额)和总销售额?创建一个具有相同维度但使用 TotalNumberOfSales 作为事实的新事实表是否合适?
感谢我能得到的有关此问题的所有意见。
最佳答案
我认为你走在正确的道路上。仅使用一张涵盖销售额的事实表就可以回答上述所有问题。
我认为应该从不聚合开始,然后在需要时聚合。考虑到一次销售可以包含多种产品和多个项目,我将其组织如下...销售中的每种产品的一个事实行(通常是发票上的行,因此我将其称为“订单行”或“销售线”),也许还有三个柜台属性:
NumItems
- 商品数量,即 3(如果客户购买了三件相同产品)。NumLines
- “订单行”的数量 - 应始终为 1。稍后聚合数据时可能会很有用(已经拥有 sum(NumLines)
而不是大胜利SQL 中的 count(*)
),或添加修正项时 (NumLines = -1
)。NumSales
- 一个小数,因此可以将其相加得出销售数量(即,如果销售涉及三种不同的产品,因此包含三个订单行,则为 0.333)。现在,人们会遇到一个问题,即如何获得正确的计数,即“涉及黑色衣服的销售数量”。我们在以前的工作场所遇到了这个问题 - 我确信一定存在一些“最佳实践”,我们最终或多或少地在事实表中引入了 SaleID
(或 TransactionID
)并执行count(distinct SaleID)
。这缺乏优雅,但有效。
在我们的设置中,我们有几个货币属性 - 最重要的是,一个是收入(支付所售商品的直接成本后剩余的收入),另一个是营业额(客户为商品支付的价格)元素)。销售税或增值税可能会增加更多复杂性。可以仅使用一个货币属性来实现,然后将销售额分成事实表中的多行,但我认为我宁愿推荐销售行事实表中的多个货币列。事实表中的所有内容均以“基础货币”(在我们的例子中为欧元)计算,然后我们有一个汇率维度来跟踪确切的金额。
我认为包含一天中的小时的日期维度没有意义。在我以前的工作中,我将仓库保存在 postgres 中,实际上我在没有日期维度的情况下管理得很好 - 尽管日期维度被认为是“最佳业务实践”,但我发现就我们所有的目的而言,性能方面我们获得了更好的性能通过使用标准 postgres 日期函数而不是拖动日期维度。我玩了很多次,我认为最终我发现最好的方法是将日期和时间分成两个不同的属性。 (时区和夏令时让我非常头疼......)
关于sql-server - 如何对事实表建模,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11430423/
SQL、PL-SQL 和 T-SQL 之间有什么区别? 谁能解释一下这三者之间的区别,并提供每一个的相关使用场景? 最佳答案 SQL 是一种对集合进行操作的查询语言。 它或多或少是标准化的,几乎所有关
这个问题已经有答案了: What is the difference between SQL, PL-SQL and T-SQL? (6 个回答) 已关闭 9 年前。 我对 SQL 的了解足以完成我的
我在数据库中有一个 USER 表。该表有一个 RegistrationDate 列,该列有一个默认约束为 GETDATE()。 使用 LINQ 时,我没有为 RegistrationDate 列提供任
我有一个可能属于以下类型的字符串 string expected result 15-th-rp 15 15/12-rp 12 15-12-th
很难说出这里问的是什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或言辞激烈,无法以目前的形式合理回答。如需帮助澄清此问题以便可以重新打开,visit the help center . 9年前关闭
我有一个存储过程(称为 sprocGetArticles),它从文章表中返回文章列表。这个存储过程没有任何参数。 用户可以对每篇文章发表评论,我将这些评论存储在由文章 ID 链接的评论表中。 有什么方
我目前正在做一个 *cough*Oracle*cough* 数据库主题。讲师介绍embedded SQL作为让其他语言(例如 C、C++)与(Oracle)数据库交互的方式。 我自己做了一些数据库工作
SQL Server 中 SQL 语句的最大长度是多少?这个长度是否取决于 SQL Server 的版本? 例如,在 DECLARE @SQLStatement NVARCHAR(MAX) = N'S
这个问题已经有答案了: Simple way to transpose columns and rows in SQL? (9 个回答) 已关闭 8 年前。 CallType
预先感谢您对此提供的任何帮助。 假设我有一个查询,可以比较跨年的数据,从某个任意年份开始,永无止境(进入 future ),每年同一时期直到最后一个完整的月份(其特点是一月数据永远不会显示至 2 月
我在数据库中有一个 USER 表。该表有一个 RegistrationDate 列,该列的默认约束为 GETDATE()。 使用 LINQ 时,我没有为 RegistrationDate 列提供任何数
下面是我试图用来检查存储过程是否不存在然后创建过程的 sql。它会抛出一个错误:Incorrect syntax near the keyword 'PROCEDURE' IF NOT EXISTS
我有一个同事声称动态 SQL 在许多情况下比静态 SQL 执行得更快,所以我经常看到 DSQL 到处都是。除了明显的缺点,比如在运行之前无法检测到错误并且更难阅读,这是否准确?当我问他为什么一直使用
来自 lobodava 的动态 SQL 查询是: declare @sql nvarchar(4000) = N';with cteColumnts (ORDINAL_POSITION, CO
使用 SQL Server 中的存储过程执行动态 SQL 命令的现实优点和缺点是什么 EXEC (@SQL) 对比 EXEC SP_EXECUTESQL @SQL ? 最佳答案 sp_executes
我有这个有效的 SQL 查询: select sum(dbos.Points) as Points, dboseasons.Year from dbo.StatLines dbos i
我正在调试一些构建成功运行的 SQL 命令的代码。 然而,在查询结束时,查询结果似乎被写入了一个文本文件。 完整的查询如下 echo SELECT DATE,DATETABLE,DATE,APPDAT
我有一些创建表的 .sql 文件(MS SQL 数据库): 表_1.sql: IF OBJECT_ID (N'my_schema.table1', N'U') IS NOT NULL DROP TAB
我写了下面的 SQL 存储过程,它一直给我错误@pid = SELECT MAX(... 整个过程是: Alter PROCEDURE insert_partyco @pname varchar(20
我在 SQL Server 2005 中有包含两列 Fruit 和 Color 的表,如下所示 Fruit Colour Apple Red Orange
我是一名优秀的程序员,十分优秀!