gpt4 book ai didi

mysql - AWS MySQL RDS 实例变得无响应并自动重启

转载 作者:可可西里 更新时间:2023-11-01 08:39:18 25 4
gpt4 key购买 nike

我们有一个大约 1.7T 大小的 AWS MySQL RDS 实例。有时会变得无响应,无法执行任何操作。

  1. CPU 利用率、写入 IOPS、读取 IOPS、队列深度、写入吞吐量、写入延迟和读取延迟降至零。
  2. 连接数堆积起来。
  3. “显示引擎 innodb 状态”挂起
  4. rdsadmin 的大量查询(每个查询大约 25 个)处于挂起状态。

    SELECT count(*) from mysql.rds_replication_status WHERE action = 'reset slave' and master_host is NULL and master_port is NULL GROUP BY action_timestamp,called_by_user,action,mysql_version,master_host,master_port ORDER BY action_timestamp LIMIT 1;

    SELECT NAME, VALUE FROM mysql.rds_configuration;
  5. 一段时间后,实例会自动重启并出现以下错误。

    启动 MySQL 重启以解决 MySQL 引起的日志备份问题。请注意,作为此解决方案的一部分,将在 MySQL 完成重启后执行数据库快照。

enter image description here

可能是什么问题?这种情况经常发生。有时,令我们惊讶的是,这种情况也会发生在非高峰时段。

最佳答案

我遇到了同样的问题并向 AWS Support 提出了一个问题。得到如下解释:


RDS 监控服务发现了有关备份数据库二进制日志的问题,这对时间点恢复 (PITR) 功能至关重要。为了缓解此问题并避免数据损坏,RDS 监控重新启动了 RDS 实例,因此自动触发了重新启动。为了确保没有数据丢失,它拍摄了数据库实例的快照。

虽然 RDS 实例是多可用区,但由于以下原因,它没有进行故障转移:

多可用区有 2 个标准:1- 单机体验,这意味着客户即使在故障转移后也总能找到他的数据。2- 比单个 AZ 更高的可用性。

因此,当 AWS 监控服务做出故障转移到备用实例的决定时,这两个条件都必须存在,但在您的情况下,AWS 监控服务注意到一些可能导致故障转移后数据丢失的风险,这就是它做出决定的原因重新启动而不是故障转移。


希望这对您有所帮助。不过,在过去的一周里,这种情况在我身上发生了 3 次。

关于mysql - AWS MySQL RDS 实例变得无响应并自动重启,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43199330/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com