gpt4 book ai didi

Riak 集群备份

转载 作者:搜寻专家 更新时间:2023-10-30 23:45:44 26 4
gpt4 key购买 nike

我们有一个五节点 Riak 集群(n_val 为 3)运行在分布在多个可用性区域的 Amazon EC2 上。由于我们没有企业版,我们没有多数据中心复制和到不同区域/区域的完全同步的奢侈。

我们目前的备份策略是这样的:

  • SSH 到集群中的每个节点,一次一个节点
  • 使用 riak stop 停止 riak 服务(因为我们正在使用 leveldb 后端)
  • 为有riak数据的数据卷发布EBS快照
  • 使用riak start启动riak服务
  • 移动到另一个节点并重复上述步骤

我已经在没有太多实时事件的 3 节点测试集群上测试了这种方法,并且可以毫无问题地从快照中恢复。我想从这里的专家那里了解这种方法是否适用于事件繁重的生产集群。在关闭节点并再次启动节点期间,我们会遇到与切换相关的任何问题吗?是否还有其他我目前没有意识到的事情,可能会在灾难发生时阻碍恢复的机会?

提前致谢!

最佳答案

backup documentation指出

Riak backups can be performed using OS features or filesystems that support snapshots, such as LVM or ZFS, or by using tools like rsync or tar

我从来没有用过EBS快照,但我很确定它可以被认为是“支持快照的文件系统”

所以,只要在备份之前关闭每个节点,就应该没问题。

关于切换:我建议您在备份节点 A 后,在备份下一个节点 B 之前,等待创建的所有切换(因为 A 已关闭)转移到 A。

注意不要将所有单个节点的备份视为“整个集群的备份”。每个节点将单独备份。如果您的集群处于繁重的写入负载下,并且您等待切换在备份之间转移,那么您不能认为您的节​​点备份是同时完成的。

这没什么大不了的:当您从备份中恢复节点时,您可以触发读取修复,或者等待 AAE 为您修复数据。当您从备份中恢复节点时,您可能希望将 AAE 配置为更具攻击性。

关于Riak 集群备份,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28874340/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com