- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在这篇文章中,我不是在问任何教程,如何做某事,在这篇文章中,我请求您的帮助,如果有人可以用简单的话解释我,什么是 DWH(数据仓库)以及什么是 ETL。
当然,我在 google 和 youtube 上搜索了很多,我发现了很多文章、视频,但我仍然不太确定它是什么。
我为什么要问?
在申请工作之前我需要非常了解它。
最佳答案
这个答案绝不应该被视为数据仓库的完整定义。这只是我尝试用外行人的术语来解释这个术语。
事务(操作、OLTP)和分析(数据仓库)系统都可以使用相同的 RDBMS 作为后端,并且它们可能包含完全相同的数据。但是,它们的数据模型将完全不同,因为它们针对不同的访问模式进行了优化。
在事务系统中,您通常使用单行(例如客户或发票),并且写入一致性至关重要,因此数据模型是标准化的。相反,数据仓库针对读取大量行(例如上一年的所有发票)和聚合数据进行了优化,因此维度模型被扁平化(星型模式、Kimball 维度和事实)。
事务系统仅存储实体的当前版本(即当前客户的地址),而数据仓库可能使用缓慢变化的维度(SCD)来保存历史记录(例如,客户的所有地址以及日期范围以指示每个地址的时间)有效)。
ETL 代表提取、转换、加载,它的过程是:
关于etl - DWH 和 ETL 解释,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28218006/
我在 postgresql 中有一个项目,用于从多个模式创建 DWH。模式具有相同的结构(表、约束)。我被困在这个问题上:我将在 DWH 中使用的所有模式中都有一个表“employees”。 sche
我正在为市场上的数据仓库/大数据工具及其功能寻找好的测试工具。我必须验证源数据和目标数据、逻辑等,并减少测试工作量。 最佳答案 您可以使用 Querysurge、Informatica DQM。 关于
我目前正在 Azure synapse DWH 工作,我有一些理论问题: 如何在表(Dim 和 Fact)之间创建关系以及如果我想创建这些关系会产生什么影响。 我读到要创建主键,我需要设置一个非聚集表
我只需要关于使用 Azure SQl DWH 进行数据库设计的一个意见 这是当前的情况: 我们正在使用 Azure SQL DWH 构建一个 DWH 系统,其来源来自 Timeseries DB,每
我在 power bi 报告中使用 Azure DWH 表。每当刷新报表查询直到刷新完成时,我都无法在 SSMS 中对同一 Azure DWH 连接执行任何查询。 请查找以下附件。 同时刷新电源bi
在这篇文章中,我不是在问任何教程,如何做某事,在这篇文章中,我请求您的帮助,如果有人可以用简单的话解释我,什么是 DWH(数据仓库)以及什么是 ETL。 当然,我在 google 和 youtube
我在 power bi 报告中使用 Azure DWH 表。每当刷新报表查询直到刷新完成时,我都无法在 SSMS 中对同一 Azure DWH 连接执行任何查询。 请查找以下附件。 同时刷新电源bi
在这篇文章中,我不是在问任何教程,如何做某事,在这篇文章中,我请求您的帮助,如果有人可以用简单的话解释我,什么是 DWH(数据仓库)以及什么是 ETL。 当然,我在 google 和 youtube
我查询 Azure SQL 数据仓库(又名 Azure Synapse),版本为: Microsoft Azure SQL Data Warehouse - 10.0.15554.0 Dec 10 2
我长期以来一直致力于本地 DWH 解决方案。现在迁移到 AZURE DWH。 现在我准备在 Azure Databricks 中进行大部分处理/转换,并将结果集写入 Azure SQL DWH 暂存表
我是 Azure 数据仓库和 Azure 数据工厂 V2 的新手。 我有一个文件夹,其中有 10 个文件,位于 azure blob 中,每个文件都有不同的 header ,但所有文件中都有 5 个共
我正在尝试使用 Azure 数据同步在 Azure sql 数据库和 Azure SQL 数据仓库之间执行复制。我有一个带有主键标识(1,1)的表。当我尝试执行同步时,我收到一条错误消息,指出与“PR
我正在尝试使用 Azure 数据同步在 Azure sql 数据库和 Azure SQL 数据仓库之间执行复制。我有一个带有主键标识(1,1)的表。当我尝试执行同步时,我收到一条错误消息,指出与“PR
一般来说,我对数据库和 SQL 还很陌生,有一个非常重要的任务,但我不知道如何解决。 鉴于我有一家公司(公司 A)和三个不同的子公司(子 A、子 B、子 C)。三个子公司生产相同的产品,可分为三个产品
直接链接DWH中的事实表可以吗? 据我了解,在银河模式事实表中没有链接,它们只是有共同的维度表。但是,如果有假设直接链接它们的 DWH 模式? 最佳答案 IMO,他们不应该,即使他们可以。事实表通常很
我有一个场景,使用本地 SSIS 将负载从本地提升并转移到 Azure SQL 数据仓库后,我想触发 Azure 自动化 Runbook。有什么办法可以完成这件事吗? 最佳答案 您可以deploy y
我是一名优秀的程序员,十分优秀!