cassandra - cassandra 中的故障检测和恢复机制如何工作？-6ren

cassandra - cassandra 中的故障检测和恢复机制如何工作？

转载作者：行者123 更新时间：2023-12-02 22:50:00

32

4

致所有 Cassandra 专家，

我正在尝试了解 cassandra 故障检测和恢复。我对它到底是如何工作的有点困惑。

来自 Datastax 文档:

Configuring the phi_convict_threshold property adjusts the sensitivity of the failure detector. Lower values increase the likelihood that an unresponsive node will be marked as down, while higher values decrease the likelihood that transient failures causing node failure. In unstable network environments (such as EC2 at times), raising the value to 10 or 12 helps prevent false failures.

来自http://ljungblad.nu/post/44006928392/cassandra-and-its-accrual-failure-detector

Phi represents the likelihood that Node A is wrong about Node B’s state.The higher the Phi, the bigger the confidence that Node B has failed.

有人可以详细解释一下C*故障检测机制以及C*如何在不同场景下恢复它吗？

提前致谢

柴蒂

最佳答案

我不认为自己是 Cassandra 专家，但以下是我对 Cassandra 的节点故障检测的看法:

每个节点每秒联系 1-3 个其他节点，询问节点状态和位置。这些带时间戳的消息已经过了Gossip 协议(protocol)。
Snitch 向分区器通知节点的机架和数据中心拓扑。动态告密可以检测节点是否以较差的性能(读取和写入)级别运行，并且在正常运行之前不会执行读取或写入操作。
提示切换是针对离线节点的分区写入的恢复机制。协调器存储写入路径上的每个节点是否确认写入操作并将提示存储在system.hints表中。如果目标节点重新上线，则会重新尝试写入。

当节点离线或性能不佳时，所有这些通信方法都会协同工作，并且可以进行配置。据我所知，Cassandra不会让节点在故障后恢复；这需要人工干预才能使节点重新上线并运行nodetool来修复故障节点上的数据。

根据您的组织对读取和写入操作的容错能力，您始终可以配置一致性级别。

管理节点故障的一些资源:

(首先检查您的 C* 版本)DataStax Failure detection and recovery
C* High Availability from Planet Cassandra
Configuring Consistency Level

关于cassandra - cassandra 中的故障检测和恢复机制如何工作？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29532159/

32

4

0

文章推荐： Javascript按行分隔字符串插入数组

文章推荐： encryption - 非网页游戏的安全在线高分列表

详解Numpy中的广播原则/机制
广播的原则如果两个数组的后缘维度(从末尾开始算起的维度)的轴长度相符或其中一方的长度为1，则认为它们是广播兼容的。广播会在缺失维度和(或)轴长度为1的维度上进行。在上面的对arr每一列减去列
MySQL 学习笔记（二）MVCC 机制
之前在讲 MySQL 事务隔离性提到过，对于写操作给读操作的影响这种情形下发生的脏读、不可重复读、虚读问题。是通过MVCC 机制来进行解决的，那么MVCC到底是如何实现的，其内部原理是怎样的呢？我们要
用于保留用户操作值的 JavaScript 机制
我创建了一个 JavaScript 对象来保存用户在 ColorBox 中检查复选框时设置的值。 . 我对 jQuery 和“以正确的方式”编程 JavaScript 比较陌生，希望确保以下用于捕获用
python - 在循环引用下理解python的import *机制
我为了回答aquestion posted here on SO而玩示例，发现很难理解python的import *破坏作用域的机制。首先是一点上下文：这个问题不涉及实际问题；我很清楚from fo
c# - 伪静态虚拟C#机制
我想让我的类具有标识此类的参数 ID。例如我想要这样的东西: class Car { public static virtual string ID{get{return "car";}} }
Java throttle 机制
更新:我使用的是 Java 1.6.34，没有机会升级到 Java 7。我有一个场景，我每分钟只能调用一个方法 80 次。它实际上是由第 3 方编写的服务 API，如果您多次调用它，它会“关闭”(忽
自动滚动到不断增长的页面底部的 Javascript 机制？
希望这对于那些使用 Javascript 的人来说是一个简单的答案...... 我有一个日志文件，该文件正在被一个脚本监视，该脚本将注销中的新行提供给任何连接的浏览器。一些人评论说，他们希望看到的更多
抑制严格标准消息的 PHP 机制
我们正在开发针对 5.2 开发的 PHP 应用程序，但我们最近迁移到了 PHP 5.3。我们没有时间去解决所有迁移到 PHP 5.3 的问题。具体来说，我们有很多消息: Declaration of
深入理解Java定时调度(Timer)机制
简介在实现定时调度功能的时候，我们往往会借助于第三方类库来完成，比如： quartz 、 spring schedule 等等。jdk从1.3版本开始，就提供了基于 timer 的定时调度功能。
Java序列化(Serialization) 机制
Java中，一切都是对象，在分布式环境中经常需要将Object从这一端网络或设备传递到另一端。这就需要有一种可以在两端传输数据的协议。Java序列化机制就是为了解决这个问题而
iphone - 如何实现自定义控制的目标 Action 机制？
我将编写自己的自定义控件，它与 UIButton 有很大不同。由于差异太大，我决定从头开始编写。所以我所有的子类都是 UIControl。当我的控件在内部被触摸时，我想以目标操作的方式触发一条消息。
delphi - 我如何知道使用了哪种 SASL 机制？
在我的代码中，在创建 TIdIMAP4 连接之前，我设置了一大堆 SASL 机制，希望按照规定的“最好到最差”顺序，如下所示: IMAP.SASLMechanisms.Add.SASL := mIdS
Kubernetes kube-proxy 机制
在 Kubernetes 中，假设我们有 3 个 pod，它们物理上托管在节点 X、Y 和 Z 上。当我使用“kubectl expose”将它们公开为服务时，它们都是集群中的节点(除了 X、Y 和
java - 游戏 build 。机制
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 9 年前。 Improve this ques
sockets - 我应该在哪个时刻使用哪种进程间通信(ipc)机制？
我知道进程间通信 (ipc) 有几种方法，例如: 文件信号 socket 消息队列管道命名管道信号量共享内存消息传递内存映射文件但是我无法找到将这些机制相互比较并指出它们在不同环境中的
java - 机制 TD2 不支持单点登录
当我尝试连接到 teradata 时，出现了TD2 机制不支持单点登录错误。在 C# 中，我遇到了类似的问题，我通过添加 connectionStringBuilder.Authetication
javascript - 绝对最简单的服务器端 Javascript 机制？
我有一个带有 JSON API 的简单 Javascript 应用程序。目前它在客户端运行，但我想将它从客户端移动到服务器。我习惯于学习新平台，但在这种情况下，我的时间非常有限 - 所以我需要找到绝对
javascript - 浏览器中的事件绑定(bind)机制
我想了解事件绑定(bind)/解除绑定(bind)在浏览器中是如何工作的。具体来说，如果我删除一个已经绑定(bind)了事件的元素，例如使用 jQuery:$("#anElement").remove
java - 假装同步的异步 websocket 机制
我不是在寻找具体答案，只是一个想法或提示。我有以下问题: Android 应用程序是 Web 服务的客户端。它有一个线程，通过 http 协议(protocol)发送事件(带有请求 ID 的 XML
linux - FreeBSD syncookies 机制
我正在研究 FreeBSD TCP/IP 栈。似乎有 2 种 syn flood 机制，syncookies 和 syncache。我的问题是关于 syncookies，它是从头开始还是在 SYN 队

首页

博学

6Ren·AI

商城

cassandra - cassandra 中的故障检测和恢复机制如何工作？