- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个 ssis 包,我使用 sql 作业运行它,以便将数据从一个数据库批量复制到另一个数据库。目标是我们的集成服务器,我们有足够的数据库空间。但是当我运行这个工作(即包)时。它在 localsettings/temp 文件夹中创建了大量临时文件,顺序为 1GB mdf 文件,它创建了一些 20GB 的临时文件。我手动创建了这个包并且没有使用导入导出向导。任何人都可以帮助我如何在执行时避免这个巨大的临时文件? 如果需要任何进一步的细节,请提及。
注意:很多人说如果我们使用导入导出向导创建一个包并为许多表设置优化,这将会发生。但是在这个包中,我只查询了一张表,并且在没有使用导入导出向导的情况下手动创建。
最佳答案
为什么包创建临时文件?
SSIS 是一种内存中 ETL 解决方案,除非它无法将所有内容都保存在内存中并开始交换到磁盘。
为什么要按照@jeff hornby 建议的帮助来重组软件包?
完全和部分阻塞的转换会强制在数据流中进行内存复制。假设您有 10 个存储桶,每个存储桶承载 1MB 的数据。当您使用阻塞转换时,当这些存储桶到达转换时,数据必须从一个内存位置复制到另一个内存位置。您现在已经将包的总内存消耗增加了一倍,因为在联合所有转换之前使用了 10MB 的数据,然后在它之后又使用了 10MB。
仅使用您需要的列。如果某列不在您的目标中,请不要将其添加到数据流中。使用数据库执行排序和合并。在数据到达数据流之前将数据转换为适当的类型。
还有什么可能导致临时文件使用
查找转换。我见过人们在使用 SELECT * FROM dbo.BillionRowTable
时破坏了他们的 ETL 服务器,而他们只需要当前时间段内的一两列。查找操作的默认行为是执行该源查询并将结果缓存在内存中。对于宽和/或深的大型表,这可能会使您的数据流看起来甚至没有运行,因为 SSIS 作为预执行阶段的一部分忙于流式传输和缓存所有这些数据。
二进制/LOB 数据。源表中有 (n)varchar(max)/varbinary(max) 或经典 BLOB 数据类型?抱歉,这不会在内存中。相反,数据流将携带一个指针,并为这些对象中的每一个写出一个文件。
并行处理过多。 SSIS 很棒,因为您可以免费并行处理您的处理。除非你可以拥有太多的好东西。如果您有 20 个数据流都漂浮在空间中,它们之间没有优先级,则集成服务引擎可能会尝试同时运行所有这些数据流。在它们之间添加一个优先约束,即使它只是在完成(成功/失败时)以强制某些操作序列化。在数据流内部,您可以通过进行不相关的操作来引入相同的挑战。我的经验法则是,从任何来源或目的地开始,我应该能够到达所有其他来源/目的地。
我还可以做些什么?
检查盒子上还有什么正在使用内存。 Have you set a sane (non-default) maximum memory value for SQL Server ? SSIS 就像 RAM 就像一个胖 child 喜欢蛋糕,所以你需要平衡 SSIS 的内存需求和数据库本身——它们有完全独立的内存空间。
每个数据流都可以设置 [BufferTempStoragePath 和 BlobTempStoragePath 2 。充分利用这一点并将其放在具有足够存储空间的驱动器上
最后,添加更多 RAM。如果您无法通过执行上述操作来使包变得更好,请向其投入更多硬件并完成。
关于ssis - 执行 SSIS 包创建巨大的没有。临时文件,这让我用完了磁盘空间,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12007910/
我有一个“有趣”的问题,即以两种不同的方式运行 wine 会导致: $> wine --version /Applications/Wine.app/Contents/Resources/bin/wi
我制作了这个网络抓取工具来获取网页中的表格。我使用 puppeteer (不知道 crontab 有问题)、Python 进行清理并处理数据库的输出 但令我惊讶的是,当我执行它时 */50 * * *
JavaScript 是否被调用或执行取决于什么?准确地说,我有两个函数,它们都以相同的方式调用: [self.mapView stringByEvaluatingJavaScriptFromStri
我目前正在使用 python 做一个机器学习项目(这里是初学者,从头开始学习一切)。 只是想知道 statsmodels 的 OLS 和 scikit 的 PooledOlS 使用我拥有的相同面板数据
在使用集成对象模型 (IOM) 后,我可以执行 SAS 代码并将 SAS 数据集读入 .Net/C# 数据集 here . 只是好奇,使用 .Net 作为 SAS 服务器的客户端与使用 Enterpr
有一些直接的 jQuery 在单击时隐藏打开的 div 未显示,但仍将高度添加到导航中以使其看起来好像要掉下来了。 这个脚本工作正常: $(document).ready(funct
这个问题已经有答案了: How do I compare strings in Java? (23 个回答) 已关闭 4 年前。 这里是 Java 新手,我正在使用 NetBeans 尝试一些简单的代
如果我将它切换到 Python 2.x,它执行 10。这是为什么? 训练逻辑回归模型 import keras.backend as
我有两个脚本,它们包含在 HTML 正文中。在第一个脚本中,我初始化一个 JS 对象,该对象在第二个脚本标记中引用。 ... obj.a = 1000; obj.
每当我运行该方法时,我都会收到一个带有数字的错误 以下是我的代码。 public String getAccount() { String s = "Listing the accounts";
我已经用 do~while(true) 创建了我的菜单;但是每次用户输入一个数字时,它不会运行程序,而是再次显示菜单!你怎么看? //我的主要方法 public static void main(St
执行命令后,如何让IPython通知我?我可以使用铃声/警报还是通过弹出窗口获取它?我正在OS X 10.8.5的iTerm上运行Anaconda。 最佳答案 使用最新版本的iTerm,您可以在she
您好,我刚刚使用菜单栏为 Swing 编写了代码。但是问题出现在运行中。我输入: javac Menu.java java Menu 它没有给出任何错误,但 GUI 没有显示。这是我的源代码以供引用:
我觉得这里缺少明显的东西,但是我看不到它写在任何地方。 我使用Authenticode证书对可执行文件进行签名,但是当我开始学习有关它的更多信息时,我对原样的值(value)提出了质疑。 签名的exe
我正在设计一个应用程序,它使用 DataTables 中的预定义库来创建数据表。我想对数据表执行删除操作,为此应在按钮单击事件上执行 java 脚本。 $(document).ready(functi
我是 Haskell 新手,如果有人愿意帮助我,我会很高兴!我试图让这个程序与 do while 循环一起工作。 第二个 getLine 命令的结果被放入变量 goGlenn 中,如果 goGlenn
我有一个用 swing 实现迷你游戏的程序,在主类中我有一个循环,用于监听游戏 map 中的 boolean 值。使用 while 实现的循环不会执行一条指令,如果它是唯一的一条指令,我不知道为什么。
我正在尝试开发一个连接到 Oracle 数据库并执行函数的 Java 应用程序。如果我在 Eclipse 中运行该应用程序,它可以工作,但是当我尝试在 Windows 命令提示符中运行 .jar 时,
我正在阅读有关 Java 中的 Future 和 javascript 中的 Promises 的内容。下面是我作为示例编写的代码。我的问题是分配给 future 的任务什么时候开始执行? 当如下行创
我有一个常见的情况,您有两个变量(xSpeed 和 ySpeed),当它们低于 minSpeed 时,我想将它们独立设置为零,并在它们都为零时退出。 最有效的方法是什么?目前我有两种方法(方法2更干净
我是一名优秀的程序员,十分优秀!