gpt4 book ai didi

amazon-ec2 - EBS Raid-0 : 9 out of 20 EBS volumes "impaired". 现在怎么办?

转载 作者:行者123 更新时间:2023-12-04 05:40:42 28 4
gpt4 key购买 nike

关闭。这个问题是off-topic .它目前不接受答案。












想改善这个问题吗? Update the question所以它是 on-topic对于堆栈溢出。

8年前关闭。




Improve this question




我有一个 ec2 实例(10GB 网络,AMI:EC2 CentOS 5.5 GPU HVM AMI(驱动程序 260.19.29)(ami-42a2532b)),在 raid-0 中附加了 20 个 EBS 卷。由于昨晚 AWS 中断,其中 9 个卷被标记为“受损,可能存在数据不一致”并禁用 I/O。该实例现已停止。卷正在等待“启用 I/O”。

此外,不属于 raid 阵列且具有根分区的小 EBS 卷也受到了损害。

AWS 建议启用受损卷的 I/O,然后对它们运行 fsck,但这当然不适用于 raid 阵列中使用的 EBS 卷。

为了尝试恢复该阵列,最安全的方法是什么?我知道我可能会失去一切,这就是为什么我们有应急计划(只是需要更多的工作和时间来恢复),但我宁愿把所有的机会都放在我身边并尝试恢复/修复阵列。那么看起来最安全的操作顺序是什么?

谢谢。

最佳答案

想提供更新并关闭此问题。基本上一切顺利,我没有任何数据损坏。 FSCK 运行得很干净,使用这个数组的并行 DB 启动得很好,一切都很好。

当我小心翼翼地走在雷区时,以下是一些有助于收集一些数据的命令:

  • mdadm --detail /dev/md0 >md0_detail获取raid 阵列的概述。
  • mdadm --examine /dev/sd[fghijklmnopqrstuvwxy] > examine_sd检查raid 阵列的每个组件。
  • grep -i checksum examine_sd验证所有校验和是否正确。
  • mount -o noatime /dev/md0 /data由于低级测试看起来不错,尝试挂载raid设备。

  • 注意事项:
  • 设备实际使用的 fs 是 ext4 (journalled)
  • 一切顺利,似乎一切都在它应该在的地方。

  • 进一步的行动:
  • umount /data在执行 fsck 之前卸载 raid 阵列。
  • fsck /dev/md0一切都干净了,没有任何问题。
  • mount -o noatime /dev/md0 /data最后,永久安装设备。
  • 关于amazon-ec2 - EBS Raid-0 : 9 out of 20 EBS volumes "impaired". 现在怎么办?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11276039/

    28 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com