- r - 以节省内存的方式增长 data.frame
- ruby-on-rails - ruby/ruby on rails 内存泄漏检测
- android - 无法解析导入android.support.v7.app
- UNIX 域套接字与共享内存(映射文件)
我最近将我的项目表切换到了 InnoDB(认为这种关系是一件好事)。我正在使用 PHP 脚本一次为大约 500 种产品编制索引。
存储单词/id 关联的表:
CREATE TABLE `windex` (
`word` varchar(64) NOT NULL,
`wid` int(10) unsigned NOT NULL AUTO_INCREMENT,
`count` int(11) unsigned NOT NULL DEFAULT '1',
PRIMARY KEY (`wid`),
UNIQUE KEY `word` (`word`)
) ENGINE=InnoDB AUTO_INCREMENT=324551 DEFAULT CHARSET=latin1
另一个表存储产品 id/word id 关联:
CREATE TABLE `indx_0` (
`wid` int(7) unsigned NOT NULL,
`pid` int(7) unsigned NOT NULL,
UNIQUE KEY `wid` (`wid`,`pid`),
KEY `pid` (`pid`),
CONSTRAINT `indx_0_ibfk_1` FOREIGN KEY (`wid`) REFERENCES `windex` (`wid`) ON DELETE CASCADE ON UPDATE CASCADE,
CONSTRAINT `indx_0_ibfk_2` FOREIGN KEY (`pid`) REFERENCES `product` (`ID`) ON DELETE CASCADE ON UPDATE CASCADE
) ENGINE=InnoDB DEFAULT CHARSET=latin1
该脚本使用 MyISAM 进行了测试,它对产品进行索引的速度相对较快(比 InnoDB 快得多)。第一次在 InnoDB 中运行时,速度慢得离谱,但在将更多值嵌套在一起后,我最终加快了很多速度(但还不够)。
由于行级锁,我假设 innodb 对于这种类型的事情会快得多,但事实并非如此。
我构建了一个类似于以下内容的查询:
SELECT
title,keywords,upc,...
FROM product
WHERE indexed = 0
LIMIT 500
我创建了一个循环并用需要添加到 windex 的所有单词和需要添加到 indx_0 的所有单词 ID/产品 ID 对填充一个数组。
因为每当我执行因重复值而失败的“REPLACE INTO”或“INSERT IGNORE INTO”时,innodb 会不断增加我的自动增量值,所以我需要确保我添加的值不存在。为此,我首先使用如下查询选择所有存在的值:
SELECT wid,word
FROM windex
WHERE
word = "someword1" or word = "someword2" or word = "someword3" ... ...
然后我根据存在的结果过滤掉我的数组,这样我添加的所有新词都是 100% 新的。
这大约占总执行时间的 20%。其他 80% 用于将对值添加到 indx_0,其中有更多的值。
这是我得到的示例。
0.4806 秒选择产品。 (总共 0.4807 秒)。
0.0319 秒收集 500 件元素。 (总共 0.5126 秒)。
5.2396 秒选择 windex 值进行比较。 (总共 5.7836 秒)。
更新计数需要 1.8986 秒。 (总共 7.6822 秒)。
0.0641 秒添加 832 条 windex 记录。 (总共 7.7464 秒)。
添加 3435 个 pid/wid 对的索引需要 17.2725 秒。 (总计 25.7752 秒)。
索引 500 个产品的操作耗时 26.07 秒。
3435 对都在单个查询中执行,例如:
INSERT INTO indx_0(pid,wid)
VALUES (1,4),(3,9),(9,2)... ... ...
在我的例子中,为什么 InnoDB 比 MyISAM 慢这么多?
最佳答案
InnoDB 提供了比 MyIsam 更复杂的键结构(FOREIGN KEYS
),并且在 InnoDB 中重新生成键非常慢。您应该将所有更新/插入语句包含在一个事务中(这些在 InnoDB 中实际上非常快,一旦我在具有 2 个索引的 InnoDb 表上进行了大约 300 000 次插入查询并且花了大约 30 分钟,一旦我将每 10 000 次插入包含在 BEGIN TRANSACTION
和 COMMIT
用了不到 2 分钟)。
我推荐使用:
BEGIN TRANSACTION;
SELECT ... FROM products;
UPDATE ...;
INSERT INTO ...;
INSERT INTO ...;
INSERT INTO ...;
COMMIT;
这将导致 InnoDB 只刷新一次索引而不是几百次。
让我知道它是否有效
关于mysql - InnoDB 插入速度非常慢并且速度变慢,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9114209/
我在想出一个算法时遇到了麻烦... 我有一系列 GPS 数据,以 1 秒为间隔记录时间、速度、距离。假设距离是米,速度是米/秒。可能有超过 2 小时的数据,或 7200 个点。这里的“时间”字段主要是
使用java排序器,即: Collections.sort(myArrayList, new Comparator() { @Override public int c
有什么区别吗 SELECT * FROM my_table 和 SELECT my_column_id FROM my_table 地点: my_table 有百万行 网站上有大量并发用户进行sql查
有2个样本。 在第一个示例中,使用 orderby 可以更快地获得结果。 (根据 phpmyadmin 速度报告) 在另一个例子中,我没有使用 order by,它给出的结果较慢。 (根据 phpmy
我注意到,如果我将训练数据加载到内存中并将其作为 numpy 数组提供到图中,与使用相同大小的 shuffle 批次相比,速度会有很大差异,我的数据有大约 1000 个实例。 使用内存 1000 次迭
我在 python 中使用破折号。我正在绘制记录到 SQLite 数据库中的实时数据,目前,我正在绘制单个值与时间线图。我计划再添加 20 个图表,但目前,随着时间的增加, plotly 变慢,我认为
我试图调用 hasNext Velocity 模板中的方法,以便根据 foreach 循环中的位置影响行为 - 仅 hasNext没有按照文档工作。 这是 Velocity 用户指南的片段,关于 ha
在我正在制作的游戏中,我有两个点,pt1 和 pt2,我想计算出它们之间的角度。我已经在较早的计算中计算出距离。显而易见的方法是对垂直距离上的水平距离进行反正切 (tan(theta) = opp/a
我经常遇到字符串值不存在和/或为空的情况。这是测试这种情况的最佳方法吗? #if( $incentive.disclaimer && $!incentive.disclaimer != '' )
我想将一个模板nested包含在其他模板cont1,cont2和cont3中。 并且嵌套模板应仅对cont1隐藏一个特定控件。 在包含在cont1中之前,我想为一些标志变量$hideMyControl
是否可以更改从“Windows Azure Media Encoder”输出的音频的播放速度? 我正在使用配置为“WMA High Quality Audio”的“Windows Azure Medi
我使用速度将String(template)与字段合并 hi there I'am ${name}, And I'am ${age} old. velocity将字段${name}和${age}与一种
我使用的是 LockedBitmap 类,它简化了 C# 中位图数据的处理。目前它正在将数据复制到本地 byte[] 数组中,然后通过其类方法访问该数组以获取/设置像素颜色值。 这比直接通过指针访问锁
我尝试在 VM_global_library.vm 文件中添加一堆 #set($x=abc) 语句,但这些变量在我的 VM 模板中不可用。 我想为图像的基本路径等设置一个全局变量。这可能吗? 最佳答案
我的项目结构: -src --main ---java ----makers -----SomeClass ---resources ----htmlPattern.vm 如何告诉 SomeClass
我正在尝试从 Velocity 中的字符串中删除不需要的字符(换行符可以,但不能像 EM 和 CAN ASCII 控制字符那样)。 #set($cleanScreen = $cleanScreen.r
我想在日.月.年之间的点处分割日期。例如:2015 年 1 月 14 日至 {14, 01, 2015}这是我使用的代码:dates3.get(0) 包含我从页面的文本字段获取的字符串“14.01.2
之后,从 1.5 升级到速度引擎 1.7 出现了 1.5 没有的问题。为了解释这个问题,我必须展示一个代码片段: #foreach($someVariable in $someCollection)
我想知道从表中选择所有字段是否更快: SELECT * 或只选择您真正需要的: SELECT field1, field2, field3, field4, field5... 假设表有大约 10 个
我正在尝试模仿照片应用程序的行为,在该应用程序中,用户用手指平移照片并且照片具有一定的速度。由于我不会深入的原因,我不能将 UIScrollView 与它的缩放 UIImageView 一起使用,而是
我是一名优秀的程序员,十分优秀!