gpt4 book ai didi

ssis - 使用 API 的 ETL/数据仓库方法

转载 作者:行者123 更新时间:2023-12-01 17:38:26 24 4
gpt4 key购买 nike

我有大约 20 个不同的数据源,所有小型应用程序都有 API(一些肥皂和一些休息)。我需要合并所有这些数据,对其进行转换并将数据存储到数据仓库中。我正在考虑 Azure SQL 数据库。但是,我不确定可以使用什么工具来实际获取 API 和数据。每个数据源在一天内可以建立的连接方面都有限制,并且大多数 API 需要运行多个 API 来获取数据。

我查看了Azure数据工厂----它不支持SOAP API我查看了 Logic Apps ---- 我不确定它是否可以执行复杂的 ETL 并可以检索数据

我想到的另一个选择是安装安装了 SQL Server 的 Azure VM,然后使用 Talend 通过 REST 和 SOAP 连接器获取数据并执行 ETL。我可以采取的另一种方法是使用 SSIS,而不是使用 Talend。但我确实相信我还需要第三方 Rest 和 Soap 连接器。

我正在寻找最具成本效益且可扩展的解决方案。

任何建议都会非常有帮助。

最佳答案

Azure 数据工厂(目前)更多的是一个转换事件的协调器,而不是一个成熟的 ETL 工具,并且它可以运行可与 Web 服务 API 配合使用的自定义事件(例如,在 C# 中)。它一直在移动。请参阅此处:

https://learn.microsoft.com/en-us/azure/data-factory/data-factory-use-custom-activities

Using Azure Data Factory to get data from a REST API

不过,考虑到您的转型规模,您是对的,您可能希望考虑替代方案。在发言时,我认为没有多少人已经解决了如何在云中复制适当复杂的本地 ETL 体验的问题 - 但这将会迅速改变。

您提到的另一个选项也可以(安装了 ETL 软件的 IaaS Azure VM)。对于 Talend,您不需要安装 SQL Server,除非您想将数据存储在其中而不是 Azure SQL 数据库中。它预装了许多连接器,如果您拥有 Talend 技能,那么它是一个不错的选择。

或者,SSIS 也可以工作:它的预加载 Web 服务任务涵盖您的 SOAP API https://www.mssqltips.com/sqlservertip/3272/example-using-web-services-with-sql-server-integration-services/您可以使用第 3 方任务/连接器进行 REST,或者使用脚本任务/转换,即您自己的自定义 C# 代码。

关于ssis - 使用 API 的 ETL/数据仓库方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43013434/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com