- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我可以在大约 36 秒内使用 Matlab 的数据库工具箱导入 200 万行。如何在 20 分钟内导入 600 万行数据?
下面查询的最后提取步骤大约需要 36 秒。
q = 'select ... from mytable limit 2000000'; %notice 2 mil limit
result = exec(conn, q);
final_result = fetch(result); % Takes about 36 seconds.
我的整个表有 6,097,227 行。 但如果我这样做:
q = 'select ... from mytable';
result = exec(conn, q);
final_result = fetch(result);
MATLAB 在最后的提取步骤中完全失去了它! CPU 使用率达到大约 500-600%(即正在使用 6/8 个内核),并且需要很长时间。目前,它设置为以 10k 批处理获取,最终在 21 多分钟内完成。
想法?怎么办? 我真的很费力地想看看这在行数上至少是如何不是大致线性的。我是不是越过了一些奇怪的限制?
顺便说一句:在使用 PostgreSQL 驱动程序等的 R 中,整个查询和导入到 R 中大约需要 43 秒......并且 0 摆弄。我可以在类似的时间内使用 ODBC 导入 Stata。
注意:在上面的查询中,...
是 10 个左右的数值变量:一些是整数,一些是 double 。都不是文字。
最佳答案
这是对像这样的大型进口的一般战略提出建议。如果您使用的任何组件未能遵循它,那么您自然会遇到问题。
首先,根据记录的平均大小分批导入 1,000 到 10,000 条记录。
其次,用单个多行INSERT
插入每个批处理:
INSERT INTO TABLE(columns...) VALUES (first-insert values), (second-insert values),...
即将每个批处理的所有记录连接成一个多行插入并以这种方式执行。它将极大地节省 IO。
关于matlab - 从 SQL 数据库 : 2 mil rows takes 30 sec, 将数据导入 MATLAB 但 600 万需要 21 分钟?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37798902/
我正在尝试用我的成员初始化列表中的多个成员来初始化一个集合,但我不确定语法。 ** 是我遇到语法错误的地方(当然没有 **)。谢谢。这是一个例子: //========================
我正在查看 1750A format webpage 中的一些示例有些例子并没有真正的意义。我在这篇文章的底部包含了 1750A 格式规范,以防有人不熟悉它。 以 1750A 格式网页的表 3 为例:
有没有人在 Python 中使用过 MIL-STD-1553?你是怎么做到的? 最佳答案 如果 1553 接口(interface)有 Windows DLL,您可以使用 ctypes 库访问它。我已
我做了一个计算器,里面有总计;假设它的结果为 1453880.45,我已经将其转为 $1,453,880.45。我希望我的函数也进行舍入并在其末尾添加 mil 或 bil(表示百万和十亿)。 例如之前
我一直在努力寻找一种很好的算法来将数字(可以是 float 或整数)更改为格式良好的人类可读数字,并将单位显示为字符串。例如: 100500000 -> '100.5 Mil' 200400 -> '
我正在尝试将 IEEE 754 32 位单精度浮点值(标准 c 浮点变量)转换为格式为 MIL-STD-1750A 的无符号长变量.我在文章底部包含了 IEEE 754 和 MIL-STD-1750A
我已经在 simulink 中实现了一个新的 Controller 逻辑,并使用 MIL(循环中的模型)仿真对其进行了测试。 在进入 HIL 之前是否必须执行 SIL? 什么样的错误可以在 SIL 中
我可以在大约 36 秒内使用 Matlab 的数据库工具箱导入 200 万行。如何在 20 分钟内导入 600 万行数据? 下面查询的最后提取步骤大约需要 36 秒。 q = 'select ...
我是一名优秀的程序员,十分优秀!