- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章使用Python如何测试InnoDB与MyISAM的读写性能由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
前言 。
由于近期有个项目对系统性能要求很高,技术选型上由于种种原因已经确定使用Mysql数据库,接下来就是要确定到底使用哪种存储引擎。我们的应用是典型的写多读少,写入内容为也很短,对系统的稳定性要求很高。所以存储引擎肯定就定在广泛使用的Innodb和MyISAM之中了.
至于两者的比较网上也有很多,但是毕竟这个事情也不复杂,决定还是自己来做,去验证一下在我们的场景下谁更优.
本文测试所用工具版本如下:
。
Tools | Version |
---|---|
MySQL | 5.7.18 |
Python | 3.6 |
Pandas | 0.23 |
。
① 创建数据表 。
首先我们需要把两张使用了不同引擎的表创建出来,使用为了方便起见,我们直接使用Navicat创建了两张 员工信息表,具体字段如下:
使用InnoDB引擎的表,设计表名为innodb,选项如下:
。
使用InnoDB引擎的表,设计表名为myisam,选项如下:
因为是简单操作,创建的具体细节就不详述了,至此,我们的数据库就把使用 InnoDB 和 MyISAM 两种引擎的表创建好了.
② 单线程写入性能对比 。
1. InnoDB 引擎 。
执行以下代码,往使用了InnoDB引擎的表格插入1000条数据 。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
|
import pandas as pd
from sqlalchemy import create_engine
import
time
db = create_engine(
'mysql+pymysql://mysql:123456@127.0.0.1:3306/test'
)
start =
time
.
time
()
for
i in range(1000):
data = {
'index'
: i,
'name'
:
'name_'
+ str(i),
'age'
: i,
'salary'
: i,
'level'
: i}
df = pd.DataFrame(data, index=[0])
df.to_sql(
'innodb'
, db, if_exists=
'append'
, index=False)
end =
time
.
time
()
print(end - start)
|
执行3次上面的代码,得到程序写入1000条数据的时间分别为:12.58s、14.10s、12.71s,平均写入时间为 13.13s.
2. MyISAM 引擎 。
执行以下代码,往使用了MyISAM引擎的表格插入1000条数据 。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
|
import
pandas as pd
from
sqlalchemy
import
create_engine
import
time
db
=
create_engine(
'mysql+pymysql://mysql:123456@127.0.0.1:3306/test'
)
start
=
time.time()
for
i
in
range
(
1000
):
data
=
{
'index'
: i,
'name'
:
'name_'
+
str
(i),
'age'
: i,
'salary'
: i,
'level'
: i}
df
=
pd.DataFrame(data, index
=
[
0
])
df.to_sql(
'myisam'
, db, if_exists
=
'append'
, index
=
False
)
end
=
time.time()
print
(end
-
start)
|
执行3次上面的代码,得到程序写入1000条数据的时间分别为:6.64s、6.99s、7.29s,平均写入时间为 6.97s.
两种引擎的单线程写入速度对比如下:
结论:单线程的情况下,MyISAM引擎的写入速度比InnoDB引擎的写入速度快88% 。
③ 多线程写入性能对比 。
1. InnoDB 引擎 。
执行以下代码,往使用了InnoDB引擎的表格插入1000条数据 。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|
import
pandas as pd
from
sqlalchemy
import
create_engine
import
time
from
concurrent.futures
import
ThreadPoolExecutor
db
=
create_engine(
'mysql+pymysql://mysql:123456@127.0.0.1:3306/test'
)
start
=
time.time()
data_lst
=
[{
'index'
: i,
'name'
:
'name_'
+
str
(i),
'age'
: i,
'salary'
: i,
'level'
: i}
for
i
in
range
(
1000
)]
def
write(data):
df
=
pd.DataFrame(data, index
=
[
0
])
df.to_sql(
'innodb'
, db, if_exists
=
'append'
, index
=
False
)
def
execute():
with ThreadPoolExecutor(max_workers
=
5
) as executor:
executor.
map
(write, data_lst)
execute()
end
=
time.time()
print
(end
-
start)
|
执行3次上面的代码,得到程序写入1000条数据的时间分别为:4.98s、4.84s、4.88s,平均写入时间为 4.9s.
2. MyISAM 引擎 。
执行以下代码,往使用了MyISAM引擎的表格插入1000条数据 。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|
import
pandas as pd
from
sqlalchemy
import
create_engine
import
time
from
concurrent.futures
import
ThreadPoolExecutor
db
=
create_engine(
'mysql+pymysql://mysql:123456@127.0.0.1:3306/test'
)
start
=
time.time()
data_lst
=
[{
'index'
: i,
'name'
:
'name_'
+
str
(i),
'age'
: i,
'salary'
: i,
'level'
: i}
for
i
in
range
(
1000
)]
def
write(data):
df
=
pd.DataFrame(data, index
=
[
0
])
df.to_sql(
'myisam'
, db, if_exists
=
'append'
, index
=
False
)
def
execute():
with ThreadPoolExecutor(max_workers
=
5
) as executor:
executor.
map
(write, data_lst)
execute()
end
=
time.time()
print
(end
-
start)
|
执行3次上面的代码,得到程序写入1000条数据的时间分别为:3.29s、3.62s、3.47s,平均写入时间为 3.46s.
两种引擎的多线程写入速度对比如下:
结论:多线程的情况下,MyISAM引擎的写入速度比InnoDB引擎的写入速度快42% 。
④ 读取性能对比 。
为了获得数据量较大的表用于测试数据库的读取性能,我们循环执行10遍上面多线程写入数据的操作,得到两张数据量为10000条数据的表格,然后读取10遍该表格,获取读取时间 。
1. InnoDB 引擎 。
执行以下代码,读取10遍使用了InnoDB引擎的表格 。
1
2
3
4
5
6
7
8
9
10
11
12
|
import
pandas as pd
from
sqlalchemy
import
create_engine
import
time
db
=
create_engine(
'mysql+pymysql://mysql:123456@127.0.0.1:3306/test'
)
start
=
time.time()
for
_
in
range
(
10
):
df
=
pd.read_sql(
'innodb'
, db)
end
=
time.time()
print
(end
-
start)
|
执行3次上面的代码,得到程序10次读取10000条数据的时间分别为:28.94s、28.88s、28.48s,平均写入时间为 28.77s.
2. MyISAM 引擎 。
执行以下代码,读取10遍使用了MyISAM引擎的表格 。
1
2
3
4
5
6
7
8
9
10
11
12
|
import
pandas as pd
from
sqlalchemy
import
create_engine
import
time
db
=
create_engine(
'mysql+pymysql://mysql:123456@127.0.0.1:3306/test'
)
start
=
time.time()
for
_
in
range
(
10
):
df
=
pd.read_sql(
'innodb'
, db)
end
=
time.time()
print
(end
-
start)
|
执行3次上面的代码,得到程序10次读取10000条数据的时间分别为:28.51s、29.12s、28.76s,平均写入时间为 28.8s.
两种引擎的读取速度对比如下:
结论:MyISAM引擎和InnoDB引擎的读取速度无明显差异 。
⑤ 总结 。
1. 写入速度,MyISAM比InnoDB快,单线程的情况下,两者差异尤为明显 。
2. 读取速度,InnoDB和MyISAM无明显差异 。
好了,以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对我的支持.
原文链接:https://www.jianshu.com/p/fc322c9042dd 。
最后此篇关于使用Python如何测试InnoDB与MyISAM的读写性能的文章就讲到这里了,如果你想了解更多关于使用Python如何测试InnoDB与MyISAM的读写性能的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
我用 chown 不行。 Bilals-MBP:~ $ sudo mkdir -p /data/db Password: mkdir: /data/db: Read-only file system
我陷入了一个非常简单的问题。 我正在尝试制作一个Qt GUI应用程序以从GUI控制我的Arduino(而不是从Arduino IDE的串行监视器控制它)。我能够使用QSerialPort write(
我正在尝试使用 Win32 的 CreateFile 函数打开一个 COM 端口。我已经在 MSDN 以及几个论坛上阅读了有关如何执行此操作的文档,但无论我做什么,我仍然收到错误代码 #2(端口不存在
我正在尝试使用系统调用 read() 和 write()。以下程序创建一个文件并将一些数据写入其中。这是代码.. int main() { int fd; open("stud
我对 Xcode 和 sqlite 有点陌生。现在我有一个名为“mydb.db”的数据库文件,它已经有一些表和数据。我把它放在我的 mac 文件夹中,然后将它拖到“支持文件”下的 Xcode 项目中。
背景:如果需要,请跳至问题部分 我正在研究测试设备的前端。前端的目的是为了更容易编写长测试脚本。几乎只是让它们更易读和可写。 设备将使用 Prologix GPIB-USB Controller 进行
本文实例讲述了python文件常见操作。分享给大家供大家参考,具体如下: 1.文件是什么? 文件是存储在外部介质上的数据或信息集合,程序中源程序、数据中保存的数据、图像中的像素数据等等; 文件
C++0x 指定 std::atomic线程安全原子访问变量的模板。这个模板有一个成员函数 std::atomic::exchange原子地在“this”中存储一个新值并检索“this”的现有值。 W
VBA 中是否有任何方法可以读取和写入 INI 文件?我知道我可以使用; Open "C:\test.ini" For Input As #1 ...并解析数据。相反,我试图查看已有哪些工具可用。 我
我最近在 GitHub 存储库 system-design-primer 上看到了系统设计示例,它显示了读/写 API。我正在尝试实现 this one 以进行练习。大纲是这样的。 它分离了读写API
我在使用 DEVMODE 结构的 dmColor 字段时遇到问题。 我的默认打印机是彩色打印机,如果我通过控制面板将打印机属性的颜色默认输出为黑白,则 DEVMODE.dmColor 字段始终返回 D
我知道套接字等如何与 java/android 配合使用,但是如何使用 java 或 python 连接到桌面上的 COM 端口?您想使用地址吗?或者查找您想要的端口是否可用或者什么? 我不知道该怎么
什么构成 DynamoDB 中的实际读取? 它是读取表格中的每一行还是返回什么数据? 这就是扫描如此昂贵的原因 - 您读取整个表格并为读取的每一行表格付费吗? 能否将 ElasticCache (Me
我想用Java编写一个程序来检查src是否存在(如果不抛出FileNoot的话) 并将src.txt的内容复制到des.txt 并在开头和结尾处打印两个文件的大小 输出为: src.txt is in
我在 C++ 中有一个 float 数组,我想将它保存到一个二进制文件中(以节省空间),以便以后能够再次读取它。为此,我编写了以下代码来编写数组: float *zbuffer = new float
我试图为 websocket 创建一个 Read\Write 函数,但我遇到了一个问题...... var inarrivo = 0; var risposta = ""; function RDW_
在我的应用程序中是用 Qt 编写的,我有一个 QGraphicsScene。在这个 QgraphicsScene 中有一个图像和一些由用户绘制的项目。我想保存这个包含所有内容的 QgraphicsSc
我正在编写一个程序,该程序应该无限期运行并保持变量的值。其他两个程序可以更改变量的值。我使用命名管道接收变量值并将其发送到外部程序。 这是我的变量管理器代码。 manager.c: #includ
我和一位老师谈过,他告诉我读写系统调用使用缓冲区,因为在你的系统规范中有一个变量控制你可以访问你想要读/写的设备的次数on,系统在他等待写入设备时使用buffer来存储数据。 我在另一篇 Stack
我运行一个方法,有三个部分,第 1 部分和第 3 部分都是“读取文本文件”, 第二部分是将字符串保存到文本文件, // The Save Path is the text file's Path, u
我是一名优秀的程序员,十分优秀!