- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
将74G数据插入mysql表花费超过2天,如何提高插入性能。
表t1如下:
+-------+----------------+------+-----+---------+-------+
| Field | Type | Null | Key | Default | Extra |
+-------+----------------+------+-----+---------+-------+
| id | varchar(50) | NO | PRI | | |
| value | varchar(10000) | YES | | NULL | |
| dt | int(11) | YES | | NULL | |
+-------+----------------+------+-----+---------+-------+
insert into t1 values(XX,XX,XX),(XX,XX,XX),(XX,XX,XX),....(XX,XX,XX)
最佳答案
VARCHAR(50) PRIMARY KEY
可能会显着减慢速度。有两种方式:
PRIMARY KEY
在插入期间处于事件状态会减慢插入速度。通常这无关紧要,并且是所需的行为,因为 PRIMARY KEY
的其他事情可以,但对于散装 INSERT
74G操作PRIMARY KEY
可能只是在你的方式,性能明智。 PRIMARY KEY
成为 VARCHAR(50)
慢PRIMARY KEY
. VARCHAR
对于
PRIMARY KEY
.
PRIMARY KEY
减速
INSERT
PRIMARY KEY
是一个经常使用的唯一索引。索引可以加快阅读速度。有很多读访问操作需要比较,例如
JOIN
查询和
WHERE X = Y
查询。如果没有索引,这些查询需要求助于线性搜索,即
O(n)
与
n
是相关表中的行数。那很慢。通过索引,这些查询求助于更智能的算法,这些算法的最佳案例访问时间通常为
O(C)
。 , 表示恒定的访问时间,以防可以使用哈希并且没有冲突,并且
O(log2(n))
如果由于哈希冲突,需要遍历排序列表或树以找到精确匹配。
INSERT
,但实际上它是一个附加操作。这是微不足道的,因为没有什么需要比较、复制或移动。对于表本身,如果您插入的行是第 1 行或第 200 亿行,这几乎没有什么区别。
O(C)
之间的读取访问操作和
O(log2(n))
.一旦找到正确的位置,插入操作就需要执行插入。也就是说,将插入位置之后的所有元素向末尾移动一个位置。
INSERT
的复杂性因此是
O(n)
.
PRIMARY KEY
,即
INSERT
以
PRIMARY KEY
的顺序执行的操作, 不保证加速
INSERT
手术。它只会加速
INSERT
操作如果
PRIMARY KEY
是一个普通数组,如果
PRIMARY KEY
则不会加速是散列的,因为在不知道所使用的散列函数的情况下,它似乎是随机的。
PRIMARY KEY
的数据类型如何影响速度
PRIMARY KEY
如果 40 亿行就足够了,我总是会使用 32 位值,否则使用 64 位值。原因很简单,在 64 位机器上,比较 32 位或 64 位值是微不足道的。这基本上归结为一条 CPU 指令,
cmp
在许多 CPU 上。如果您使用
VARCHAR
, 的比较要复杂得多。它需要逐字节比较一个字符串。根据所使用的 DBMS、区域设置和排序规则,它甚至可能比这更复杂。
PRIMARY KEY
的特例
PRIMARY KEY
形式的
CREATE TABLE Person (
id INT PRIMARY KEY AUTO_INCREMENT,
name VARCHAR(50)
);
AUTO_INCREMENT
它基本上保证了新的键被附加在索引的末尾,并且 MySQL 自己生成新的唯一值。
INSERT
的 PRIMARY KEY操作并在 INSERT 操作后重新启用它。这应该会显着加快速度。不会有任何减慢插入操作的东西。并创建一个
INDEX
afterwords 大致具有排序操作的复杂性。
关于mysql - 将74G数据插入mysql表花费超过2天,如何提高插入性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27718749/
我正在比较工作簿中的工作表。该工作簿有两张名为 PRE 和 POST 的工作表,每张工作表都有相同的 19 列。行数每天都不同,但特定一天的两张表的行数相同。该宏将 PRE 工作表中的每一行与 POS
我有一个对象数组,我一次循环遍历该数组一个对象,然后进行几次检查以查看该数组中的每个对象是否满足特定条件,如果该对象满足此条件,则复制一个属性将此对象放入数组中(该属性还包含另一个对象)。 for(v
我正在编写一个必须非常快的应用程序。我使用 Qt 5.5 和 Qt Creator,Qt 的 64 位 MSVC2013 编译版本。 我使用非常困倦的 CS 来分析我的应用程序,我看到占用最多独占时间
我有以下 CountDownTimer 在我的 Android 应用程序中不断运行。 CountDownTimer timer_status; timer_status = new CountDown
有一个优化问题,我必须调用随机森林回归器的预测函数数千次。 from sklearn.ensemble import RandomForestRegressor rfr = RandomForestR
我正在努力提高现有 Asp.Net Web 应用程序的数据访问层的性能。场景是。 它是一个基于 Web 的 Asp.Net 应用程序。 数据访问层使用 NHibernate 1.2 构建并作为 WCF
我在我的 Intel Edison 上运行 Debian,并尝试使用 ffmpeg 通过 USB 网络摄像头捕获视频。我正在使用的命令是: ffmpeg -f video4linux2 -i /dev
我有一个 For循环遍历整数 1 到 9 并简单地找到与该整数对应的最底部的条目(即 1,1,1,2,3,4,5 将找到第三个“1”条目)并插入一个空白行。我将数字与仅对应于此代码的应用程序的字符串“
我有一个带有非规范化架构(1 个表)的 postgresql 数据库,其中包含大约 400 万个条目。现在我有这个查询: SELECT count(*) AS Total, (SELECT c
在 Ltac 中实现复杂的策略时,有一些 Ltac 命令或策略调用我预计会失败以及预期失败(例如终止 repeat 或导致回溯)。这些故障通常在故障级别 0 时引发。 更高级别引发的故障“逃避”周
我正在尝试提高 ansible playbook 的性能。我有一个测试剧本如下: --- - name: Test hosts: localhost connection: local g
我正在使用 axios从 Azure 存储 Blob 下载文件 (~100MB)。 axios({ method: 'get', url: uri, onDownloadProgress:
我有一个 ClojureScript 程序,主要对集合执行数学计算。它是在惯用的、独立于主机的 Clojure 中开发的,因此很容易对其进行基准测试。令我惊讶的是(与答案对 Which is fast
我有一个程序必须在硬件允许的情况下尽快发出数千个 http 请求。在现实世界中,这些连接中的每一个都将连接到一个离散的服务器,但我已经编写了一个测试程序来帮助我模拟负载(希望如此)。 我的程序使用 A
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
我正在计算 Clojure 中 3d 点云的边界框。点云表示为 Java 原始浮点数组,点云中的每个点都使用 4 个浮点存储,其中最后一个浮点未使用。像这样: [x0 y0 z0 u0 x1 y1
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the he
我正在尝试使用rayshader 包制作图像。我很高兴能够使用如下代码创建一个 png 文件: library(ggplot2) library(rayshader) example_plot <-
更新 显然,jQuery 模板可以被编译,并且它有助于显示带有 if 语句 的模板的性能 here . 但是如图here ,预编译的 jQuery 模板对我的情况没有多大作用,因为我的模板不包含逻辑
我是编程新手。我有一个启用分页的 ScrollView ,其中包含许多页面(最多十个),并且在每个页面上都有一个自定义按钮。每个自定义按钮都有一个自定义图像。我在 Interface Builder
我是一名优秀的程序员,十分优秀!