- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我认为这是一个很常见的问题,希望有我们可以重用的解决方案/方法。
我们正在 Azure ADLS gen2 中构建数据湖,具有单向数据流:Nifi/ADF -> ADLS -> ETL/Spark/Databricks -> 数据仓库 -> Power BI
。一些 ETL 输入应由负责任的业务用户每周/每月加载/更新。
您能否建议/改进业务用户上传 ETL 输入的解决方案,并满足以下要求?
需求成就的估计范围为 1(非常糟糕的实践方法)到 5(100% 干净、易于实现的解决方案)。
Upload files from Power Apps to Data Warehouse.
流程:业务用户 -> Power Apps -> 数据仓库和存储过程 -> ADLS -> Spark -> 数据仓库 -> Power BI
。
DW -> ADLS -> DW
。更难推理和协调。 使用 Spark/Databricks 而不是 ADLS 事件/触发器。
流程:业务用户 -> Microsoft Storage Explorer 应用 -> ADLS gen2 -> Azure Blob 存储触发器 -> Azure Function -> Spark 解析/验证作业 -> ADLS gen2
最佳答案
据我了解,您正在寻找具有以下功能的单向 ETL 流程/架构(按优先级排序):
用户友好的定义也有点模糊,因为用户最终会习惯使用不直观的工具 - 例如,您可以强制他们参加类(class)。我知道有些商业用户对使用例如Power BI,但他们没有任何选择不使用它。
我的总体经验是,根据业务需求量身定制的定制前端会比让用户使用一把巨大的一体化瑞士军刀(用户日常只使用其中的几个功能)更满意商业。我从未见过 PowerApps 被使用,但我从他们的网站和 https://alternativeto.net/software/microsoft-powerapps/ 得到的信息这是某种低代码应用程序/UI 构建平台。
我个人会选择拥有大量用户社区的低代码工具,例如Tableau、Qlik 或 Appian。我与它们中的任何一个都没有关联,但我设法相当快地将它们全部连接到 SQL 数据库,这就是我提到这三个数据库的原因。
你说
The Storage Explorer has enough user friendly interface, and has zero cost to implement. The only concern is about validation-feedback and audit. In order to mitigate validation - we may create some king of Excel templates for business users.
所以我猜你可能会选择这个解决方案,但我永远不会牺牲审计。与备份类似,人们通常只有在发生意外时才知道没有备份或审计的真正成本是什么。如果发生网络攻击,或 white collar crimes ,企业通常非常需要日志文件。
关于azure - 业务用户上传 Data Lake ETL 输入的解决方案,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61340510/
我有以下正则表达式 /[a-zA-Z0-9_-]/ 当字符串只包含从 a 到z 大小写、数字、_ 和 -。 我的代码有什么问题? 能否请您向我提供一个简短的解释和有关如何修复它的代码示例? //var
我是一名优秀的程序员,十分优秀!