- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我敢肯定,这是一个非常模糊的问题,很难回答,但如果您能提供有关该主题的任何一般性想法,我将不胜感激。
让我简要介绍一下背景。
十年前,我们曾经编写数据加载,从遗留应用程序读取输入平面文件,并将它们加载到我们的数据集市中。最初,我们的加载程序是用 VB6 编写的,并在平面文件和每条记录中游标,执行以下一般过程:
1) 查找记录。如果找到,更新它2) 否则插入新记录
然后我们最终更改此过程以使用 SQL Server 对临时表中的平面文件进行 DTS,然后我们将对临时表与目标生产表执行大规模集基连接,从临时表中获取数据并使用它来更新目标表。插入了未加入的记录。
这是流程的简化,但本质上,流程从迭代方法变为“基于集合”,不再一次执行更新 1 条记录。结果,我们获得了巨大的性能提升。
然后我们在 DLL 中创建了我认为是一组功能强大的共享函数,以使用这种方法执行常见的功能/更新模式。它极大地抽象了开发并真正缩短了开发时间。
然后 ETL 工具 Informatica PowerCenter 应运而生,管理人员希望对该工具进行标准化并重写使用 DTS 的旧 VB 负载。
我听说 PowerCenter 会迭代处理记录,但我知道它确实做了一些优化技巧,所以我很好奇 Informatica 的性能如何。
有没有人有使用 DTS 或 SSIS 的经验,能够根据直觉预测哪个通常表现更好?
最佳答案
我加入了一个同时使用 Informatica PowerCenter 8.1.1 的组织。虽然我不能代表一般的 Informatica 设置,但我可以说 Informatica 在这家公司的效率极低。主要问题是 Informatica 在后端生成了一些非常糟糕的 SQL 代码。当我使用探查器观察它在做什么并查看文本日志时,它为需要插入/更新/删除的每一行生成了单独的插入、更新和删除语句。我没有尝试修复 Informatica 实现,而是将其替换为 SSIS 2008。
我在使用 Informatica 时遇到的另一个问题是管理并行化。在 DTS 和 SSIS 中,并行化任务非常简单——不定义优先约束,您的任务将并行运行。在 Informatica 中,您定义一个起点,然后定义用于并行运行流程的分支。我无法找到一种方法来限制并行进程的数量,除非我通过链接工作集或任务来明确定义它们。
就我而言,SSIS 的性能大大优于 Informatica。我们使用 Informatica 的加载过程大约需要 8-12 个小时。我们使用 SSIS 和 SQL Server 代理作业的加载过程大约需要 1-2 小时。我敢肯定,如果我们正确调整 Informatica,我们可以将负载减少到 3-4 小时,但我仍然认为它不会做得更好。
关于ssis - DTS/SSIS 与 Informatica Power Center,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3693920/
我有一些自定义控制流和数据流任务未显示在 SSIS 工具箱中。当我在 SSDT 中打开包含自定义任务的包时,加载该包时出现几个错误。 加载 MyModuleTemplate1.dtsx 时出错:由于错
我有一个现有的 SSIS 包 (load1),它将数据从一台服务器 (srv1) 加载到我的服务器 (srv2)。在我可以运行 load1 之前,还有 2 个其他负载需要在 srv1 上运行,然后 l
我有点困惑 async方法是否适用于 SSIS 作业。脚本任务项创建一个面向 .NET Framework 4.5 的 Visual Studio 项目,输出类型为类库。 如果我制作主要方法 publ
有没有一种方法可以在 SSIS 执行期间动态创建目标文件夹而不使用脚本任务,例如。我有代码 123、133、143,如果不存在,我想在下面创建一个文件夹位置 D:\Outbox\ACI\123 D:\
我需要执行 29 个 ssis 包。所以计划创建一个主包来执行所有这些包。我不知道如何实现这一点。能否请您简要解释一下。提前致谢 ! 最佳答案 这篇文章很好地概括了主包的功能,它基本上是一个在控制流中
我有一个像这种格式的字符串。就我而言,我只需要从字符串大小写中提取字符 1)12AB 2)SD12 3)1WE4 输出 1)AB 2)SD 3)WE 我只需要提取字符。我在 SSIS 包的派生列中使用
使用: Windows 7 企业版; Visual Studio Pro 2017 (15.3.5);固态硬盘 15.1 无法让数据查看器在我的 SSIS 包上弹出。我确实做了一些 Google-fu
我可以使用什么模式/通配符来分别获取以下两个文件?目前,我正在使用此模式 CRM#ContractsBillingAccount*.csv 但两个文件名都符合此模式。如何避免? CRM#Contrac
是否可以在脚本任务中将发生的异常重定向到另一个表/日志?如果是这样,该怎么做? 最佳答案 您可以在脚本任务中执行在 vb.net 或 C# 中可以执行的任何操作。但是如果你在一个脚本任务中做了这么多,
我使用 CSV 中的以下内容来测试 SCD。我认为它会识别 LocationID 并在必要时更新记录。但它没有。它只插入新记录。 我正在使用带有 Win 身份验证的 Visual Studio 201
我对 SSIS 事务隔离级别的问题很少。 考虑一个场景:我有一个执行 SQL 任务,它在表 A 中插入数据。这个任务指向一个数据流任务,它读取以前插入到 A 上的数据。我已经启动了分布式事务,如果我在
你好 我正在创建一个需要按指定顺序执行以下操作的 ssis 包: 1:处理一些数据 2:将该数据移动到其他一些表 3:获取一些数据并将其推送到纯文本文件中。 我为这些创建了 3 个存储过程,我为 1
使用SQLServer 2012 Enterprise,在“控制流”选项卡中单击鼠标右键时,在SSIS中看不到“程序包配置向导”。我可以看到所有其他项目(日志,数字签名...)。 以下是有关我的安装的
我有一个 Foreach 容器,其中有一个 执行进程任务 。我有很多 Console.WriteLine() 语句。 图像中突出显示的 3 个图像可用于从 .exe 获取输出。 我在包中声明了一个变量
SSIS 非常擅长处理所有记录都相同的平面文件,但当存在一点复杂性时就不太好了。 我想导入一个与此类似的文件 - Customer: 2344 Name: John Smith Item
当我在 SSIS 包 (ProtectionLevel) 上设置权限并输入 PackagePassword 时,当我在计算机上打开包时,它不会提示我输入密码。 我做错了吗? 最佳答案 你可能没有做错什
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 7年前关闭。 Improve thi
我致力于创建 biml。从中生成 ssis 包。构建 SSIS 项目,然后在服务器上部署 ispac 文件。 但是这些所有手动步骤都可以自动化吗? 我可以使用命令行从 biml 生成 ssis 吗?除
我已经创建了一个 SSIS 包。如果包失败,我需要将事务应用于此包以进行回滚。我发现的是一个属性“TransactionOption”,它应该被赋予“Required”。我对吗 ?并且我已将包的 Tr
我在 Visual Studio 2015 中向 SSIS 添加自定义 SSIS 组件时遇到问题。 我的系统是:Windows 8.1 64 位 Visual Studio 社区 2015 版14.0
我是一名优秀的程序员,十分优秀!