gpt4 book ai didi

Azure 数据工厂 - Oracle 源性能糟糕

转载 作者:行者123 更新时间:2023-12-03 00:27:24 25 4
gpt4 key购买 nike

在 Azure 数据工厂中工作,使用内置的 Oracle 连接器...

给定一个非常简单的查询,例如:

SELECT Col001, Col002, Col003 FROM APPS.WHATEVER_TABLE;

这种类型的查询大约有 30 列,可以在不到 60 秒的时间内将 1,000,000 行流传输到小型虚拟机上的 Toad。从完全相同的 Oracle 服务器,在 Azure 数据工厂的自托管集成运行时内,此查询需要 8 分钟以上,并且频繁暂停/挂起。

在此期间,IR 盒中的 CPU 运行速度约为 30%。在此期间,IR 盒上的可用内存保持在 5GB 或以上。无论 Azure SQL 数据库接收器的 DTU 级别如何,这都会执行相同的操作。今天,我在 800 DTU 和 3,000 DTU 之间进行了尝试,并获得了完全相同的性能,Azure SQL 数据库上的日志 I/O 保持在 10% 或以下。

ADF Oracle Connector 的文档对此没有任何帮助,因为它没有提供任何关于如何调整连接字符串参数的指导,或者实际上是否可以这样做。

想法?

最佳答案

分辨率:

我们开始怀疑数据类型出了问题,因为如果我们将所有高精度 Oracle NUMBER 列转换为较低精度或整数等类型,问题就会消失。

情况变得如此糟糕,我们就此向 Microsoft 立案,我们最担心的事情得到了证实。

Azure 数据工厂运行时小数类型的最大精度为 28。如果源中的小数/数字值具有更高的精度,ADF 将首先将其转换为字符串。字符串转换代码的性能很糟糕。

检查您的源是否具有任何高精度数字数据,或者如果您没有显式定义架构,请查看您是否意外使用了字符串。

关于Azure 数据工厂 - Oracle 源性能糟糕,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54187379/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com