oracle - 以 Oracle 作为源在 Synapse 专用池中加载 6 亿多条记录-6ren

oracle - 以 Oracle 作为源在 Synapse 专用池中加载 6 亿多条记录

转载作者：行者123 更新时间：2023-12-03 02:16:22

27

4

我正在尝试完全加载位于 Oracle On-Prem 数据库中的一个非常大的表(600 多万条记录)。我的目的地是 Azure Synapse 专用池。

我已经尝试过以下操作:

将 ADF 复制事件与源分区结合使用，因为源表有 22 个分区

我将复制并行度和 DIU 提高到了很高的水平

尽管如此，我只能在 3 小时内获取 1.5 亿条记录，而要求是在大约 2 小时内完成完整加载，因为在这段时间内源将被卡住给用户，以便 Synapse 可以复制数据

如何在该时间范围内将数据从 Oracle 完整复制到 Synapse？

为了进行更改，我尝试将数据从 Oracle 加载到 ADLS Gen 2，但速度也很慢

最佳答案

这里需要考虑很多因素。一些想法:

读取表格的速度有多快？有哪些索引/物化 View ？数据库级别是否存在需要排除的争用？
建议:确保数据库设置为快速读取您要导出的表
由于您在本地，本地网卡设置和吞吐量是多少？
建议:确保本地网络设置尽可能快
由于您在本地，因此必须使用自托管集成运行时 (SHIR)。这台机器的规范是什么？例如，根据最低规范，8GB RAM、用于假脱机的 SSD 等。这是在哪里？例如，“靠近”数据源(在同一本地网络中)或在云中。可以通过 up to four nodes 来扩展 SHIR但在扩展之前，您应该通过可用的指标确保这是一个瓶颈。
建议:考虑将 SHIR 放置在“靠近”数据源的位置(即在同一网络中)
SHIR 软件版本是最新的吗？此内容偶尔会更新，因此最好保持更新。
建议:保持 SHIR 软件最新
您有 Express Route 或互联网吗？急诊室可能会更快
建议:考虑使用 Express Route。或者考虑Data Box用于大量一次性导出。
您几乎肯定应该直接登陆 ADLS Gen 2 或 blob 存储。直接进入数据库可能会导致那里的争用，并且您正在处理 Synapse 概念，例如事务日志记录、DWU、资源类和队列争用等。查看 Azure 门户中的存储指标以确定其是否处于压力之下。如果处于压力之下(我认为不太可能)，请考虑多个存储帐户
建议:将数据加载到 ADLS2。尽管这看起来像是一个额外的步骤，但它提供了一个恢复点，并通过尝试同时进行提取和加载来避免争用问题。如果你能证明它运行得更快并且你绝对不需要恢复点，我只会直接加载到数据库
您以什么格式降落在湖中？例如，转换为 Parquet 是相当计算密集型的。登陆湖上确实会留下审计线索，并让您在出现问题时可以恢复
建议:使用 parquet 作为压缩格式。您可能需要优化文件大小。
最终最好的办法是进行一次大批量加载(比如利用周末)，然后使用 CDC 机制进行增量更新插入。这样您就可以满足 2 小时的时间要求。
建议:考虑一次性大批量加载和 CDC/增量加载，以保持在时间表内

总之，这可能是您的网络问题，但您首先需要进行大量调查，然后再使用我上面列出的一些选项来解决。

关于oracle - 以 Oracle 作为源在 Synapse 专用池中加载 6 亿多条记录，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/71079140/

27

4

0

文章推荐： sorting - Elasticsearch.Net用NEST计算自定义文档项目得分

文章推荐： javascript - Loop、DNS 和 Bluebird Js - Promise 仍然异步工作

文章推荐： audio - DVD损坏的框架

文章推荐： javascript - 处理可选的 API 查询字符串参数

json - Gatsby:在页面上组合两个 graphql 源(.json 和 .jpg 源)
语境我正在将一个旧的 php 电子商务网站变成一个用 gatsby.js 构建的静态网站。我将所有产品元数据放入单独的 .json 文件(每个产品一个)，并且我能够使用 json 和文件转换器插件
macos - 触控板手势切换到标题/源
我曾经能够使用三指向上滚动在源/标题之间切换。自从升级到 Lion 后，我只进行常规滚动。有没有办法恢复该功能？ Aka，当我像以前那样向上/向下滚动时，它不会跳到对应的位置。更新 Apple 在
javascript - 有没有办法根据jquery中克隆元素的更改来更新clone()源？
我有一个包含复选框输入的克隆元素。当克隆的元素未被选中时，我需要也取消选中源元素。有没有办法在 jQuery 中做到这一点？或者我是否以错误的方式处理这个问题(即使用clone())？我应该提到我的问
java - JSpinner 源？
我有一个类，其中有两个 JSpinner 对象，x 和 y。我有一个更改监听器，它已添加到两者中。有人可以告诉我如何实现我的更改监听器，以便监听器可以区分两个对象之间的区别。例如伪代码: if(sou
c - MPI_Allreduce 源
我正在编写涉及 for 循环的代码，该循环在每个索引处进行计算。这些计算中的最小值存储在一个变量中，我在程序末尾使用 MPI_Allreduce 来确定所有进程的全局最小值。但是，我需要一种方法来
安卓自定义 map 源
我需要在一个 Android 项目中创建一个 map View ，我从服务器获取自定义 map 图 block PNG。有人知道实现此类功能的简单许可 API 吗？最佳答案我使用了 OsmDroi
jquery - 源/背景网址/？
因为我必须创建一个可以更改图像 (src/background-url) 的函数。我想知道如何识别标签以及它是使用 src 还是 url 来访问图像。让我们说早些时候我写了一个可以
javascript - 源 map 资源管理器中的未映射字节是什么
当我使用源 map 浏览器 https://github.com/danvk/source-map-explorer要检查捆绑包中的内容，我得到以下输出: D:\projects\angular\mT
windev - 导出 Windev 源
我正在为客户将 Windev 应用程序移植到 Objective-C。出于显而易见的原因，使用以前的源代码会更简单。不幸的是，它是加密的，我需要 EDI 才能看到它；完整版的 Windev 太贵了(
wpf - 更改没有闪烁的 MediaElement 源
我有一个简单的视频播放器，它使用 WPF MediaElement 播放一系列视频。这些视频一起形成一个围绕静止图像移动的连续电影。在每个视频结束时，运动会卡住在当前播放视频的最后一帧。当我按下一个按
javascript - 如何更改打开的图层图 block 源？
我需要更改 openlayer 的图层源(使用 open weather api)。目前我正在使用以下代码但没有成功。 let layer = this.map.getLayers().getArra
java - 如何更改随机数据的 Java 源？
我正在尝试在 /dev/random 的机器上运行代码不会很快填满，我正在尝试使用的 Java 程序因缺少随机数而挂起。/dev/urandom产生“不太好”的随机数，但不会阻塞，对于这种情况，我宁愿
yocto - 构建 Yocto 源
我需要 Yocto 项目的源代码包。我已经拥有整个项目的所有资源，但它们还包括开发工具。我想有一种方法来生成将为目标图像构建的所有包的(修补的)源。因此，例如，如果目标图像包含 busybox，我想
javascript - 隐藏 iFrame 源
如何对入侵者隐藏 iFrame src 假设我正在流式传输我的网络摄像头或我的电脑屏幕，这是 iframe 代码: 并且我不希望它在大多数浏览器上显示页面源中的流 URL 和检查功能! 这意
qt - 调试到 Qt 源
是否可以进入 Qt 源，例如qmainwindow.cpp，在 Qt Creator 中？目前我正在看到反汇编，但最好能看到源代码。最佳答案当然!但您可能必须首先: 转到 $QT_HOME/qt
javascript - 如何通过单击链接更改视频 js 源
我正在尝试创建一个包含很少动漫剧集的简单网站。我有一个关于 javascript 的问题。如何通过单击我的链接之一来更改视频源？我明白，我必须使用事件监听器，只需更改取决于我点击的链接，但我不太擅长
c# - 如何清除绑定(bind)源？
我有一个带有 BindingSouce 的 DevExpress GridControl。我想清除 BindingSource 并用新数据填充它。我这样做: var list = new List()
jquery - 使用附加参数更新服务器处理的 DataTables 源
当单击提交输入按钮时，我尝试将其他参数(选定复选框的列表)传递到服务器处理的 DataTables 表#my_table: 这可能意味着我必须将 my_table.sAjaxSource 设置为后端脚
delphi - 制作没有基础(源)文件的增量文件？
(好吧，别对我大喊大叫，这里已经很晚了:)) 我正在研究 delta diff 工具(命令行工具或组件，只要我可以从 Delphi 2010 调用它们就可以了) 我有这个项目，我将文件上传到服务器，我
macos - 解析雅虎天气 RSS 源
我需要解析 Yahoo Weather RSS feed 中的某个位置，例如 http://weather.yahooapis.com/forecastrss?w=44418&u=c例如，获取最高、最

首页

博学

6Ren·AI

商城

oracle - 以 Oracle 作为源在 Synapse 专用池中加载 6 亿多条记录