- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个应用程序,我知道它可以制作一个很棒的多维数据集,并且比标准的平面 Reporting Services 报表更有用。我们即将与一名顾问一起进入 BI 领域,但我想在此之前先试一试,主要是因为我知道我们将要做什么。
该应用程序跟踪全国疗养院的调查。它们可以是年度调查、投诉调查或其他几种类型的调查,它们具有与给出的标签相关的处罚,并具有与之相关的文档。
我想做的是想出一种方法,让我们能够利用我们拥有的数据 - 佛罗里达州 6 月份有多少标签?有多少设施按时交付文件?与去年相比,今年第一季度发生了多少次年度(惊喜)调查?
我将模式包括在内,希望有人能够告诉我不仅什么是模糊的,什么是事实,还有什么数据去哪里了。我认为这将是一个很好的开始。
任何事情都会很有帮助。我正在尝试建立一个小型数据集市,同时我正在研究 Kimball 的数据仓库生命周期工具包。
谢谢!男@
实体表 - 我们所有设施的列表:主键是表示建筑物的五个字母代码
CREATE TABLE [dbo].[Entity](
[entID] [varchar](10) NOT NULL,
[entShortName] [varchar](150) NULL,
[entNumericID] [int] NOT NULL,
[orgID] [int] NOT NULL,
[regionID] [int] NOT NULL,
[portID] [int] NOT NULL,
[busTypeID] [int] NOT NULL,
[adpID] [varchar](50) NULL,
[eHealthDataID] [varchar](50) NULL,
[updateDate] [datetime] NULL CONSTRAINT [DF_Entity_updateDate] DEFAULT (getdate()),
[powProID] [int] NULL,
[regionReportingID] [int] NULL,
[regionPresEmail] [varchar](300) NULL,
[regionClinDirEmail] [varchar](300) NULL,
CONSTRAINT [PK_EntityNEW] PRIMARY KEY CLUSTERED
(
[entID] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON, FILLFACTOR = 75) ON [PRIMARY]
) ON [PRIMARY]
调查主要
CREATE TABLE [dbo].[surveyMain](
[surveyID] [int] IDENTITY(1,1) NOT NULL,
[surveyDateFac] AS (([facility]+'-')+CONVERT([varchar],[surveyDate],(101))),
[surveyDate] [datetime] NOT NULL,
[surveyType] [int] NOT NULL,
[surveyBy] [int] NULL,
[facility] [varchar](10) NOT NULL,
[originalSurvey] [int] NULL,
[exitDate] [datetime] NULL,
[dpnaDate] AS (dateadd(month,(3),[exitDate])),
[clearedTags] [varchar](1) NULL,
[substantiated] [varchar](1) NULL,
[firstRevisit] [int] NULL,
[secondRevisit] [int] NULL,
[thirdRevisit] [int] NULL,
[fourthRevisit] [int] NULL,
[updated] [datetime] NULL CONSTRAINT [DF_surveyMain_updated] DEFAULT (getdate()),
CONSTRAINT [PK_tagSurvey] PRIMARY KEY CLUSTERED
(
[surveyID] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON, FILLFACTOR = 90) ON [PRIMARY]
) ON [PRIMARY]
调查类型:
CREATE TABLE [dbo].[surveyTypes](
[surveyTypeID] [int] IDENTITY(1,1) NOT NULL,
[surveyTypeDesc] [varchar](100) NOT NULL,
CONSTRAINT [PK_surveyTypes] PRIMARY KEY CLUSTERED
(
[surveyTypeID] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
) ON [PRIMARY]
调查文件
CREATE TABLE [dbo].[surveyFiles](
[surveyFileID] [int] IDENTITY(1,1) NOT NULL,
[surveyID] [int] NOT NULL,
[surveyFilesTypeID] [int] NOT NULL,
[documentDate] [datetime] NOT NULL,
[responseDate] [datetime] NULL,
[receiptDate] [datetime] NULL,
[dateCertain] [datetime] NULL,
[fileName] [varchar](250) NULL,
[fileUpload] [image] NULL,
[fileDesc] [varchar](100) NULL,
[updated] [datetime] NOT NULL CONSTRAINT [DF_surveyFiles_updated] DEFAULT (getdate()),
CONSTRAINT [PK_surveyFiles] PRIMARY KEY CLUSTERED
(
[surveyFileID] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON, FILLFACTOR = 75) ON [PRIMARY]
) ON [PRIMARY] TEXTIMAGE_ON [PRIMARY]
调查罚款
CREATE TABLE [dbo].[surveyFines](
[surveyFinesID] [int] IDENTITY(1,1) NOT NULL,
[surveyID] [int] NULL,
[surveyFinesTypeID] [int] NULL,
[dateRecommended] [datetime] NULL,
[dateImposed] [datetime] NULL,
[totalFineAmt] [varchar](100) NULL,
[wasImposed] [varchar](3) NULL,
[dateCleared] [datetime] NULL,
[comments] [varchar](500) NULL,
[updated] [datetime] NOT NULL CONSTRAINT [DF_surveyFines_updated] DEFAULT (getdate()),
CONSTRAINT [PK_surveyFines] PRIMARY KEY CLUSTERED
(
[surveyFinesID] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON, FILLFACTOR = 75) ON [PRIMARY]
) ON [PRIMARY]
调查标签
CREATE TABLE [dbo].[surveyTags](
[seq] [int] IDENTITY(1,1) NOT NULL,
[surveyID] [int] NOT NULL,
[tagDescID] [int] NOT NULL,
[tagStatus] [int] NULL,
[scopesev] [varchar](5) NOT NULL,
[comments] [varchar](1000) NULL,
[clearedDate] [datetime] NULL,
[updated] [datetime] NULL CONSTRAINT [DF_surveyTags_updated] DEFAULT (getdate()),
CONSTRAINT [PK_tagMain] PRIMARY KEY CLUSTERED
(
[seq] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON, FILLFACTOR = 90) ON [PRIMARY]
) ON [PRIMARY]
最佳答案
What I'd like to do is come up with a way that will allow us to leverage the data we have - how many tags in Florida for the month of June? How many facilities were on time delivering their documentation? How many annual(surprise) surveys happened in the 1st quarter of this year compared to last year?
维度是一个测量范围。测量范围可以是连续的,如日期,也可以是离散的,如设施。在您的问题中,维度分别是设施和日期、日期/时间和日期。
您可以回答“佛罗里达州 6 月份有多少标签?”这个问题的唯一方法。是将标签与设施相关联,将标签与日期相关联。
您可以回答“有多少设施按时交付文件?”这个问题的唯一方法?是将文档交付与设施和到期日期与设施相关联。
对于您希望数据仓库回答的其他问题或查询,您应该遵循相同的分析过程。
事实是实体或对象。标签是事实。文档交付是事实。一旦加载,事实在数据仓库中几乎总是不可变的。
至于您的架构,我必须对其进行更多研究才能给出具体建议,但总的来说,您希望使用 star schema 。星星的中心是你的事实、实体和对象。构成星形点的表是您的维度表。
您需要做的第一件事是将事实和维度分开。您的任何实体表都不应包含日期、位置代码或您确定为维度的任何其他内容。但是,事实表将包含日期表、位置表或其他维度表的外键。
您可能还需要汇总表。汇总表包含与事实表相同的列,并添加了一个或多个跨不同维度的总和。例如,问题“佛罗里达州 6 月份有多少标签?”如果您已经有了 2010 年 6 月当月(或每一天)佛罗里达州(或者更准确地说是佛罗里达州的每个设施)的标签总和,则可以更快地得到答案。
求和的时间段取决于您预期的查询组合。在您的数据仓库中,一天可能太短了。换句话说,在 SQL 中进行汇总与选择汇总行一样快。
你需要一个 calendar table 也是。日历表会提出诸如“与去年(第一季度)相比,今年第一季度发生了多少年度(意外)调查?”之类的问题。更容易查询。
关于data-warehouse - 什么是 Dim,什么是 Fact?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3189512/
我正在尝试寻找除“日期维度”示例之外的半加性事实的实时示例。 即可以总结除时间以外的所有维度的措施。 我正在寻找半加性事实示例,其中无法跨时间以外的维度汇总度量。 提前致谢。 -灰 最佳答案 账户余额
我正在尝试为我的一个项目(销售订单)设计数据仓库的维度建模。我是这个概念的新手。 到目前为止,我可以理解产品、客户和日期可以存储在维度表中,而订单信息将存储在事实表中。 Date_dimension
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
我正在使用 Kimball 的方法为数据仓库项目进行我的第一个维度建模任务。当我准备模型并考虑物理对象时,我想知道推荐的数据库对象命名方案是什么。我们将使用Oracle,目前我们没有任何标准。任何帮助
我想知道为什么以及何时需要数据仓库,我的意思是数据仓库的主要目标是从多维 View 提供报告,但在某些情况下,有一种方法可以使用 DBMS 构建报告,它可以生成报告从多维来看,关于数据库的大小,大小可
我知道在数据仓库维度中使用代理键是有充分理由的。 尽管如此,我还是不明白如何将它们链接到我的事实表的外键。 在事实表中,我只有在 ETL 期间提取的自然键。原始数据库表中不存在代理键。 对此有何建议?
是否有任何情况下我可以有文本字段,例如事实表中的描述? 我目前有一个 session 事件事实表(粒度:每次 session 行),其中包含多个维度,例如日期、客户、地点等。我需要将 session
我用 2 个事实表和 16 个维度表和 4 个公共(public)维度表制作了一个事实星座模式。需要对维度表之一进行规范化,因为来自数据源的数据可以具有可变数量的行。我还能称它为在维度表中有分支的事实
我想了解如何在实时 DWH 环境中利用代理键。我知道他们增加了不依赖于源生成的数据来存储每个维度键的好处,并且实际上还避免了从维度的自然键中构建的复合键,例如,(prod id + cust id +
我有一个能源消耗事实表如下: f_meter_data: utc_calendar_id local_calendar_id meter_id reading timestamp 日历表是按照 Kim
我有一个带有 8 个外键(引用 8 个维度)的事实表,但即使所有八个键的组合也不能唯一标识一行。我是否需要从原始数据中添加另一个属性(即“project-id”属性,它对任何东西都没有用),以便我可以
借助 MongoDB、CouchDB 和相关技术,我们可以加快查询速度,这是否仍然有效? “交易数据的副本,经过专门重组以供查询和分析。” (R. Kimball 数据仓库工具包,1996 我的意思是
在数据仓库中,我们有慢慢改变尺寸的概念。我只是想知道为什么不存在“缓慢/快速更改FACT”的行话,因为可以使用相同的Type1,Type 2度量来跟踪FACT表中的更改。 最佳答案 根据DW神,FAC
我正在尝试设计我的第一个数据集市,其中包含来自 Excel 表的星型架构,其中包含有关帮助台服务调用的信息,该表包含 33 个字段,其中包括不同的信息,我无法识别事实表,因为我想做稍后根据不同的 KP
我被要求对星图进行建模。 我有 3 个维度: 日期(日、月、年、周、季度、...) 位置(500 个不同的值) 产品(80k 种不同的产品) 主要问题是一天结束时每个地方存储了多少元素(产品)。 经过
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
我正在建立一个数据仓库。每个事实都有它的timestamp。我需要按天,月,季度但按小时创建报告。查看示例,我看到日期倾向于保存在维表中。 (来源:etl-tools.info) 但是我认为,时间没有
我是数据仓库的新手。首先,我要比将数据仓库工具包的副本精确到邮箱(蜗牛邮件:P)要精确得多。但是我已经在网上找到了所有这些东西。 但是,当您似乎在DW中拥有多个事实时,该怎么办呢?就我而言(保险),我
需要对维度建模或星型模式有所了解。 通常,我们在设计数据仓库时都会有事实表和维度表。 但是,在事实表中嵌入维度确实有意义。特别是对于没有其他属性并且很少更改其值的简单维度。 在事实表中有维度会使查询运
添加新维度(一个全新的表,而不是现有维度表的新行)的标准做法是什么?难道您不必重做整个事实表,添加一个新字段,然后根据新维度表中的代理键填充它吗?有没有更简单的方法来做到这一点? 最佳答案 只要新维度
我是一名优秀的程序员,十分优秀!