- 使用 Spring Initializr 创建 Spring Boot 应用程序
- 在Spring Boot中配置Cassandra
- 在 Spring Boot 上配置 Tomcat 连接池
- 将Camel消息路由到嵌入WildFly的Artemis上
目前只要是大型互联网项目都是采用分布式结构,一个系统可能有多个节点组成,每个节点都可能需要维护一份数据。那么如何维护各个节点之间的状态,如何保障各个节点之间数据的同步问题就是大家急需关注的事情了。CAP定理是分布式系统中最基础的原则。所以理解和掌握了CAP,对系统架构的设计至关重要。
1998年,加州大学的计算机科学家Eric Brewer 提出,分布式系统有三个指标
Consistency
:一致性Availability
:可用性Partition tolerance
:分区容错性它们的第一个字母分别是CAP。Eric Brewer 说,这三个指标不可能同时做到。这个结论就叫做CAP定理又被称为布鲁尔定理。
下面我们将分别讲解cap定理的每个字母的含义 👇
Consistency 中文叫做 一致性(这里指的是强一致性)所有节点访问同一份最新的数据副本。也就是说,在一致性系统中,一旦客户端将值写入任何一台服务器并获得响应,那么之后client从其他任何服务器读取的都是刚写入的数据!
举个例子❗
某条记录是v0,用户(client)向G1发起一个写操作,将其改为v1。
接下来,用户(client)的读操作就会得到v1。这就叫一致性。
问题是,用户(client)有可能向 G2 发起读操作,由于 G2 的值没有发生变化,因此返回的是 v0。G1 和 G2 读操作的结果不一致,这就不满足一致性了。
为了让 G2 也能变为 v1,就要在 G1 写操作的时候,让 G1 向 G2 发送一条消息,要求 G2 也改成 v1。
这样的话,用户向 G2 发起读操作,也能得到 v1。
Availability 中文叫做 可用性,意思是系统中非故障节点只要收到用户的请求,服务器就必须给出回应。稍详细点说就是在可用系统中,如果我们的客户端向服务器发送请求,并且服务器未崩溃,则服务器必须最终响应客户端,不允许服务器忽略客户的请求!
用户可以选择向 G1 或 G2 发起读操作。不管是哪台服务器,只要收到请求,就必须告诉用户,到底是 v0 还是 v1,否则就不满足可用性。
Partition tolerance 中文叫做 分区容错。大多数分布式系统都分布在多个子网络。每个子网络就叫做一个区(partition)。分区容错的意思是,区间通信可能失败,分布式系统要能容忍这种情况。
比如,一台服务器放在中国,另一台服务器放在美国,这就是两个区,它们之间可能无法通信。
上图中,G1和G2是两台跨区的服务器。G1 向 G2 发送一条消息,G2 可能无法收到。系统设计的时候,必须考虑到这种情况。
一般来说,分区容错无法避免,因此可以认为CAP的P总是成立
。CAP定理告诉我们,剩下的C和A无法同时做到。
为什么同时满足呢?我们通过下方例子进行说明。
假设确实存在三者能同时满足的系统
那么我们要做的第一件事就是分区我们的系统,由于满足分区容错性,也就是说可能因为通信不佳等情况,G1和G2之间是没有同步!
接下来,我们的客户端将v1写入G1,但G1和G2之间是不同步的,所以如下G1是v1数据,G2是v0数据。
由于要满足可用性,即一定要返回数据,所以G1必须在数据没有同步给G2的前提下返回数据给client。
client请求的是G2服务器,由于G2服务器的数据是v0,所以client得到的数据是v0
很明显,G1返回的是v1数据,G2返回的是v0数据,两者不一致无法同时满足我们的cap定理。
关注一致性和可用性,它需要非常严格的全体一致的协议,比如“两阶段提交”(2PC)。CA 系统不能容忍网络错误或节点错误,一旦出现这样的问题,整个系统就会拒绝写请求,因为它并不知道对面的那个结点是否挂掉了,还是只是网络问题。唯一安全的做法就是把自己变成只读的。
关注一致性和分区容忍性。它关注的是系统里大多数人的一致性协议,比如:Paxos 算法 (Quorum 类的算法)。这样的系统只需要保证大多数结点数据一致,而少数的结点会在没有同步到最新版本的数据时变成不可用的状态。这样能够提供一部分的可用性。
这样的系统关心可用性和分区容忍性。因此,这样的系统不能达成一致性,需要给出数据冲突,给出数据冲突就需要维护数据版本。Dynamo 就是这样的系统。
最终的选择的关键点还是要取决于业务场景
对于大多数互联网应用来说(如网易门户),因为机器数量庞大,部署节点分散,网络故障是常态,可用性是必须需要保证的,所以只有设置一致性来保证服务的AP。
对于需要确保强一致性的场景,如银行,通常会权衡CA和CP模型,CA模型网络故障时完全不可用,CP模型具备部分可用性,实际的选择需要通过业务场景来权衡(并不是所有情况CP都好于CA,只能查看信息不能更新信息有时候从产品层面还不如直接拒绝服务)
所以,我看过一个关于 TDD 的视频,其中演示者说,你应该只对类的一部分进行单元测试,即为外部世界提供一些东西。他提到这很好,因为这种方法可以确保类遵守“契约(Contract)”,因此它履行了其职责
在CAP定理中,Redis被指定为缺乏可用性(具有分区容错性和一致性)的数据库。 但是在很多地方,Redis 被认为是一种高可用的键值存储。 什么是对的?如果您能提供深入的答案,我将不胜感激。 最佳答
我正在尝试证明以下内容: 1-pow : ∀ {n : ℕ} → 1 pow n ≡ 1 1-pow {zero} = refl 1-pow {suc x} = {!!} 我是 Adga 的新手,甚
我正在努力解决这个问题 - 我实际上已经找了一整天了! 我想我理解它背后的主要概念,但我正在努力弄清楚创建将形状投影到其上的 Axis 所需的数学? 因此,如果我有一个矩形,我会找出每个点,然后使用它
我试图证明以下内容: 1-pow : ∀ {n : ℕ} → 1 pow n ≡ 1 1-pow {zero} = refl 1-pow {suc x} = {!!} 我是 Adga 的新手,甚至不
所以我想计算任何给定三角形内的点数。我知道我必须使用 Pick 定理,但我的代码最终变得非常长,其中包含用于测试每种情况的 if-else if 语句的数量。我一直以此为指导 How many int
当说系统是 CP(一致性和分区)时,这是否意味着我们不能在复制的数据节点之间使用异步同步,并且每次写入都必须同步(甚至是事务性)复制? 据我了解,一致性意味着对于每次写入,后续读取(来自任何节点)都将
虽然我试图理解CAP中的“可用性”(A)和“分区容忍度”(P),但我发现很难理解各种文章的解释。 我感觉 A 和 P 可以走到一起(我知道事实并非如此,这就是我无法理解的原因!)。 深入浅出,A和P是
foundationdb 声明在 consistency 上吗?有效的? FoundationDB provides the strongest possible consistency model,
Azure 本身是 PaaS,而不是 IaaS。你同意? MS保证99%的可用性和强一致性。您可以在此处找到 MS SLA:http://www.microsoft.com/windowsazure/
我正试图掌握 Python 的 fft 功能,我偶然发现的一件奇怪的事情是 Parseval's theorem似乎不适用,因为它现在给出了大约 50 的差异,而它应该是 0。 import nump
我正在尝试在 Coq 中进行证明,并且我想使用我已经定义和证明的引理。以下代码可以吗? Lemma conj_comm: forall A B : Prop, A /\ B -> B /\ A. Pr
我试图通过 Isabelle(定理证明者)的 Isar 章节,第一个陈述是: lemma "¬ surj(f :: 'a ⇒ 'a set)" 我想了解什么是常数surj曾是。我知道查找定理很容易:
我想在分布式系统中使用 aerospike。 Aerospike 官方文档说: Aerospike 系统被归类为 AP 任何人都可以照亮它吗? Aerospike如何保证分布式环境下的AP模式。 最佳
这code example to generate a list of definitions对我有用,但只适用于一个索引列表。每当我尝试添加另一个列表(例如,对于定理)时,只有在设置垃圾中最后定义的
我打算使用 memcached 数据库。根据我的要求,高性能(速度)和可用性是最高优先级的。(一致性可以在某种程度上进行交易)请建议使用合适的数据库。 我正在关注 CAP Theorem . 按类别我
根据 CAP Consistency - All nodes gave the same data Availability means the ability to access the clust
如果我正确理解了 CAP 定理,可用性意味着即使节点出现故障,集群也会继续运行。 我见过很多人(http://blog.nahurst.com/tag/guide)将RDBMS列为CA,但我不明白RB
根据我目前所读到的有关 CAP 定理的所有内容,没有分布式系统可以同时提供这三者:可用性、一致性和分区容错性。 现在,Hadoop 2.x 引入了一项新功能,可以对其进行配置以消除 hadoop 集群
目前,我正在考虑拍摄图像及其光谱。现在 Parceval 的定理说两者应该具有相等的能量。然而,当我尝试在某些图像上对此进行测试时,numpy 真实 FFT 函数似乎并非如此。 这是我用于测试的代码:
我是一名优秀的程序员,十分优秀!