- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我在 MySQL 中的输入表有 2000 万条记录,而在 Oracle 中的目标表是空的。我需要将整个表从 MySQL 加载到 Oracle 中。我只是使用表输入和表输出步骤。
我的意图是在读取时不要长时间锁定源表。我试图达到的负载(记录数)有问题吗?我可以在表输出中看到 Use batch update for inserts
选项。我在表输入中看不到类似的东西。有没有办法在 Pentaho 中执行批处理?
最佳答案
别担心,2000 万条记录对于 PDI 来说是一个小数字,如果它是开放输入的,您不会锁定表。这就是为什么 Bulk load
是针对输出表而不是输入表的原因。
然而,一个常见的初学者陷阱是输出表上的 Truncate table
选项。如果您运行(不经意地或为了并行处理)两次输出步骤,每一个都会锁定另一个。永远。
要加快速度:您可以在输入时使用惰性转换
复选框,以便数据在使用之前保持字节格式。但我不确定您是否在简单的输入/输出表上赢得了一些东西。如果在写入输出文件时 Dates 或 Blob 出现问题,错误消息将非常含糊。
您还可以通过增加提交大小(在 Oracle 中最差的几次试验)和增加 行集中的行数
来提高输出速度,这将增加行数由表输入
读取。为此,请右键单击任意位置,然后单击 Properties/Miscelanous
。
我真正建议做的事情是增加 JVM 内存大小。使用编辑器(记事本或更好的工具)编辑名为 spoon.bat
的文件。您会在第 94-96 行附近找到一行,其中包含类似“-Xmx256K”的内容。将其更改为“-Xmx4096M”(其中 4096 是您机器 RAM 大小的一半)。
执行“批处理”有很多意义。其中之一是 使转换数据库事务化
。您可以使用上面提到的 Number of row in rowset
正下方的复选框(在 PDI 最新版本中错误地拼写为 Make the transformation database
)。选中该框后,如果出现问题,数据库的状态将回滚,就好像从未执行过转换一样。但我不建议您这样做。
关于mysql - Pentaho 表输入到表批量输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45328274/
我有一个测试即将进行,我想澄清两个有关参数的问题。 在我的笔记中指出,将参数传递给函数的推荐方法是使用“按引用传递” const type& x; // for "in" parameters
当我通过 OMG 2.5(Beta)推广的 UML 规范阅读以下概念时: in: Indicates that Parameter values are passed in by the caller
我试图在用户按下 Enter 时触发一个函数。我将此输入设置为只读的原因是限制用户在填充值后修改输入中的值。 该值来自将在点击属性中触发的弹出窗口。问题是 keyup.enter 没有触发该输入。 代
我在jQuery中使用模式弹出窗口控件,该弹出窗口具有由jQuery Tokenize输入插件提供动力的输入文本。问题是,当我在模式弹出文本框中键入内容时, token 化插件的搜索结果显示为隐藏在弹
我有一个问题。当我选中复选框时,系统工作正常,总值发生变化,但一旦我修改文本输入,它就会变为 0。我需要将此文本框输入排除在更改值之外。 这是 html: $15000 $
我正在努力让它发挥作用,但还是有些不对劲。 我想用 CSS 设置提交按钮的样式以匹配我已有的按钮。 风格: input[type="button"], input[type="submit"], b
import java.util.*;; public class selection { Scanner in=new Scanner(System.in); private
这可能是一个非常菜鸟的问题。假设我有一个带宽限制为 100MB/s 的网卡,那么输入/输出带宽是否有可能达到该限制 同时 ?或者我会在任何时候遇到这个不等式:in bandwidth + out ba
看着这个问题,Fill immutable map with for loop upon creation ,我很好奇是什么this表示在 Map(1 -> this) . scala> Map(1
我有这样的东西 一个 乙 问? 是或否 数字 数字或零 我想做的是: 如果 B1 = “Y”,则让用户在 B2 中输入一个数字。 如果 B1 = “N”,则将 B2 中的值更改为零,并且不允许用户在
我有一个包含许多列的表,我想添加 input标题单元格内的字段,但我希望输入适合根据正文内容的宽度。 这是没有 input 的样子领域: 这就是 input 的样子领域: 可以看出,像“index”和
关于为 FTP 客户端设置传出和传入文件夹,您遵循哪些最佳实践(如果有)?我们通常使用“outgoing”和“incoming”,但无论你如何表述方向,它都可以有两种解释方式,具体取决于名称相对于哪一
我正在尝试“求解”给定 d 的 Pell 方程:x^2 - d * y^2 = 1,或者至少我想得到最小的 x > 0 来求解方程。到目前为止,一切都很好。这是我的 Haskell 代码 minX :
我是VS Code的新手,可以使用Ctrl + Enter将代码运行到python交互式窗口中。我希望光标自动移动到下一行,因此我可以逐行浏览代码。 能做到吗? 最佳答案 如this blog pos
我正在创建一个 bool 值矩阵/二维数组,并且我想为 dategrid 推断一种不仅仅是“ANY”的类型。 let yearRange = [2000,2001,2002,2003,2004]; l
我有两个排序的列表,例如 a = [1, 4, 7, 8] b = [1, 2, 3, 4, 5, 6] 我想知道a中的每个项目是否在b中。对于上面的示例,我想找到 a_in_b = [True, T
菜鸟警报 这很奇怪 - 当我编写以下代码时,尝试在 AngularJS 中创建自定义指令: myModule.directive('myTab', function(){ console.lo
已关闭。此问题需要 debugging details 。目前不接受答案。 编辑问题以包含 desired behavior, a specific problem or error, and the
假设我正在使用 gdscript 静态类型,并且对于一个函数参数,我事先不知道我会得到什么。这就是 python 中 typing.Any 的作用。如何使用 gdscript 做到这一点? 似乎 Va
我使用 dropzone 上传多个图像,并且工作正常,直到我想为每个图像插入品牌和网址。 我遇到的唯一问题是,当我要从输入字段获取值时,我会从服务器获取来自字段(品牌、网址)的未定义值,但如果我使用静
我是一名优秀的程序员,十分优秀!