- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章关于MySQL报警的一次分析处理详解由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
最近有一个服务出现了报警,已经让我到了忍无可忍的地步,报警信息如下:
Metric:mysql.innodb_row_lock_waits Tags:port=4306,service=xxxx diff(#1): 996>900 。
大概的意思是有一个数据库监控指标 innodb_row_lock_waits 目前超出了阈值900 。
但是尴尬的是,每次报警后去环境中查看,得到的信息都很有限,慢日志,错误日志里面都没有充分的信息可以分析,一来二去之后,我开始静下心来分析这个问题的原因.
首先这个报警信息的时间点貌似是有些规律的,我拿着最近几天的报警时间做了比对,发现还是比较有规律的,那么在系统层面有哪些任务可能会触发呢,我查找比对了相关的任务配置,发现有一个定时任务每1分钟会执行一次,但是到了这里疑问就来了,如果每1分钟执行1次,为什么在特定的时间会产生差异较大的处理结果?当然这个现象的解释是个起始.
其实要证明这一点还是蛮容易的,今天我就采取了守株待兔的模式,我在临近报警的时间前后打开了通用日志,从日志输出来看,操作的频率还是相对有限的.
很快得到了规律性的报警,于是我开始抓取相关的通用日志记录,比如11:18分,我们可以采用如下的模式得到相关的日志,首先得到一个临时的通用日志文件,把各种DML和执行操作都网罗进来.
cat general.log|grep -E "insert|delete|update|select|exec" > general_tmp.log 。
我们以11:18分为例,可以在前后1两分钟做比对,结果如下:
# less general_tmp.log |grep "11:18"|wc -l 。
400 。
# less general_tmp.log |grep "11:17"|wc -l 。
666 。
# less general_tmp.log |grep "11:16"|wc -l 。
15 。
发现在报警的那1分钟前后,数量是能够对得上的.
这个表的数据量有200多万,表结构如下:
1
2
3
4
5
6
7
8
9
10
11
12
|
CREATE
TABLE
`task_queue` (
`AccID`
bigint
(20)
NOT
NULL
AUTO_INCREMENT COMMENT
'自增ID'
,
`TaskStepID`
bigint
(20)
DEFAULT
NULL
COMMENT
'任务步骤ID task_step_conf'
,
`QOrder`
int
(11)
DEFAULT
NULL
COMMENT
'队列排序 task_step_confi.Step_ID'
,
`QState` tinyint(4)
DEFAULT
'1'
COMMENT
'队列状态 1:待执行 2:执行中 3:执行成功 4:执行失败'
,
`QExcCount`
int
(11)
DEFAULT
'1'
COMMENT
'执行次数'
,
`CrtTime` datetime
DEFAULT
NULL
COMMENT
'创建时间'
,
`ModTime` datetime
DEFAULT
NULL
COMMENT
'修改时间'
,
PRIMARY
KEY
(`AccID`),
KEY
`idx_taskstepid` (`TaskStepID`),
KEY
`idx_qstate` (`QState`)
) ENGINE=InnoDB AUTO_INCREMENT=3398341
DEFAULT
CHARSET=utf8
|
在日志中根据分析和比对,基本能够锁定SQL是在一类Update操作上面,SQL的执行计划如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
>>explain update task_queue
set
QState=1,QExcCount=QExcCount+1,modtime=now() where QState=0 and taskstepid =411\G
*************************** 1. row ***************************
id
: 1
select_type: UPDATE
table: task_queue
partitions: NULL
type
: index_merge
possible_keys: idx_taskstepid,idx_qstate
key: idx_qstate,idx_taskstepid
key_len: 2,9
ref: NULL
rows: 11
filtered: 100.00
Extra: Using intersect(idx_qstate,idx_taskstepid); Using where; Using temporary
|
这个执行结果中key_len是2,9,是和以往的ken_len计算法则不一样的。 其中Extra列已经给出了明确的提示,这是一个intersect处理,特别的是它是基于二级索引级别的处理,在优化器层面是有一个相关的参数index_merge_intersection.
我们知道在MySQL中主键是一等公民,而二级索引最后都会映射到主键层面处理,而索引级别的intersect其实有点我们的左右手,左手对应一些数据结果映射到一批主键id,右手对应一些数据结果映射到另外一批主键id,把两者的主键id值进行intersect交集计算,所以在当前的场景中,索引级别的intersect到底好不好呢?
在此我设想了3个对比场景进行分析,首先这是一个update语句,我们为了保证后续测试的可重复性,可以转换为一个select语句.
1
|
select
*
from
task_queue
where
QState=0
and
taskstepid =411;
|
所以我们的对比测试基于查询语句进行比对分析.
场景1:优化器保持默认index_merge_intersection开启,基于profile提取执行明细信息 。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
>explain
select
* from task_queue where QState=0 and taskstepid =411\G
*************************** 1. row ***************************
id
: 1
select_type: SIMPLE
table: task_queue
partitions: NULL
type
: index_merge
possible_keys: idx_qstate,idx_taskstepid
key: idx_qstate,idx_taskstepid
key_len: 2,9
ref: NULL
rows: 11
filtered: 100.00
Extra: Using intersect(idx_qstate,idx_taskstepid); Using where
1 row
in
set
, 1 warning (0.00 sec)
|
profile信息为:
场景2:优化器关闭index_merge_intersection,基于profile进行对比 。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
|
>
set
session optimizer_switch=
'index_merge_intersection=off'
;
>explain
select
* from task_queue where QState=0 and taskstepid =411\G
*************************** 1. row ***************************
id
: 1
select_type: SIMPLE
table: task_queue
partitions: NULL
type
: ref
possible_keys: idx_qstate,idx_taskstepid
key: idx_qstate
key_len: 2
ref: const
rows: 1451
filtered: 0.82
Extra: Using where
1 row
in
set
, 1 warning (0.00 sec)
|
profile信息为:
场景3:重构索引,进行比对分析 。
根据业务逻辑,如果创建一个复合索引,是能够大大减少结果集的量级的,同时依然保留 idx_ qsta te 索引,使得一些业务依然能够正常使用.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
>alter table task_queue drop key idx_taskstepid;
>alter table task_queue add key `idx_taskstepid` (`TaskStepID`,QState);
explain
select
* from task_queue where QState=0 and taskstepid =411\G
*************************** 1. row ***************************
id
: 1
select_type: SIMPLE
table: task_queue
partitions: NULL
type
: ref
possible_keys: idx_qstate,idx_taskstepid
key: idx_taskstepid
key_len: 11
ref: const,const
rows: 1
filtered: 100.00
Extra: NULL
1 row
in
set
, 1 warning (0.00 sec)
|
profile信息为:
可以明显看到通过索引重构,“Sending data”的部分少了两个数量级 。
所以接下里的事情就是进一步进行分析和验证,有理有据,等待的过程也不再彷徨,一天过去了,再没有收到1条报警,再次说明在工作中不要小看这些报警.
总结 。
到此这篇关于关于MySQL报警分析处理的文章就介绍到这了,更多相关MySQL报警处理内容请搜索我以前的文章或继续浏览下面的相关文章希望大家以后多多支持我! 。
原文链接:https://www.tuicool.com/articles/FrAzi27 。
最后此篇关于关于MySQL报警的一次分析处理详解的文章就讲到这里了,如果你想了解更多关于关于MySQL报警的一次分析处理详解的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
对于 Metal ,如果对主纹理进行 mipmap 处理,是否还需要对多采样纹理进行 mipmap 处理?我阅读了苹果文档,但没有得到任何相关信息。 最佳答案 Mipmapping 适用于您将从中
我正在使用的代码在后端 Groovy 代码中具有呈现 GSP(Groovy 服务器页面)的 Controller 。对于前端,我们使用 React-router v4 来处理路由。我遇到的问题是,通过
我们正在 build 一个巨大的网站。我们正在考虑是在服务器端(ASP .Net)还是在客户端进行 HTML 处理。 例如,我们有 HTML 文件,其作用类似于用于生成选项卡的模板。服务器端获取 HT
我正在尝试将图像加载到 void setup() 中的数组中,但是当我这样做时出现此错误:“类型不匹配,'processing .core.PImage' does not匹配“processing.
我正在尝试使用其私有(private)应用程序更新 Shopify 上的客户标签。我用 postman 尝试过,一切正常,但通过 AJAX,它带我成功回调而不是错误,但成功后我得到了身份验证链接,而不
如何更改我的 Processing appIconTest.exe 导出的默认图标在窗口中的应用程序? 默认一个: 最佳答案 经过一些研究,我能找到的最简单的解决方案是: 进入 ...\process
我在 Processing 中做了一个简单的小游戏,但需要一些帮助。我有一个 mp3,想将它添加到我的应用程序中,以便在后台循环运行。 这可能吗?非常感谢。 最佳答案 您可以使用声音库。处理已经自带
我有几个这样创建的按钮: 在 setup() PImage[] imgs1 = {loadImage("AREA1_1.png"),loadImage("AREA1_2.png"),loadImage
我正在尝试使用 Processing 创建一个多人游戏,但无法弄清楚如何将屏幕分成两个以显示玩家的不同情况? 就像在 c# 中一样,我们有Viewport leftViewport,rightView
我一直在尝试使用 Moore 邻域在处理过程中创建元胞自动机,到目前为止非常成功。我已经设法使基本系统正常工作,现在我希望通过添加不同的功能来使用它。现在,我检查细胞是否存活。如果是,我使用 fill
有没有办法用 JavaScript 代码检查资源使用情况?我可以检查脚本的 RAM 使用情况和 CPU 使用情况吗? 由于做某事有多种方法,我可能会使用不同的方法编写代码,并将其保存为两个不同的文件,
我想弄清楚如何处理这样的列表: [ [[4,6,7], [1,2,4,6]] , [[10,4,2,4], [1]] ] 这是一个整数列表的列表 我希望我的函数将此列表作为输入并返回列表中没有重复的整
有没有办法在不需要时处理 MethodChannel/EventChannel ?我问是因为我想为对象创建多个方法/事件 channel 。 例子: class Call { ... fields
我有一个关于在 Python3 中处理 ConnectionResetError 的问题。这通常发生在我使用 urllib.request.Request 函数时。我想知道如果我们遇到这样的错误是否可
我一直在努力解决这个问题几个小时,但无济于事。代码很简单,一个弹跳球(粒子)。将粒子的速度初始化为 (0, 0) 将使其保持上下弹跳。将粒子的初始化速度更改为 (0, 0.01) 或任何十进制浮点数都
我把自己弄得一团糟。 我想在我的系统中添加 python3.6 所以我决定在我的 Ubuntu 19.10 中卸载现有的。但是现在每次我想安装一些东西我都会得到这样的错误: dpkg: error w
我正在努力解决 Rpart 包中的 NA 功能。我得到了以下数据框(下面的代码) Outcome VarA VarB 1 1 1 0 2 1 1 1
我将 Java 与 JSF 一起使用,这是 Glassfish 3 容器。 在我的 Web 应用程序中,我试图实现一个文件(图像)管理系统。 我有一个 config.properties我从中读取上传
所以我一直在Processing工作几个星期以来,虽然我没有编程经验,但我已经转向更复杂的项目。我正在编写一个进化模拟器,它会产生具有随机属性的生物。 最终,我将添加复制,但现在这些生物只是在屏幕上漂
有人知道 Delphi 2009 对“with”的处理有什么不同吗? 我昨天解决了一个问题,只是将“with”解构为完整引用,如“with Datamodule、Dataset、MainForm”。
我是一名优秀的程序员,十分优秀!