gpt4 book ai didi

distributed-system - CAP 定理中可用性的一致性

转载 作者:行者123 更新时间:2023-12-04 02:01:51 24 4
gpt4 key购买 nike

In the wikipedia article on CAP Theorem( https://en.wikipedia.org/wiki/CAP_theorem ), it states (bold emphasis mine) "When choosing consistency over availability, the system will return an error or a time-out if particular由于网络分区,无法保证信息是最新的。”

如果是这样,选择一致性而不是可用性是否意味着我们也失去了分区容错性?系统可能已启动,但如果它为我的所有数据访问返回错误,那有什么用呢?或者,“网络分区”在这里也意味着数据分区吗?换句话说,如果还隐含了数据分区,则至少已知部分数据是最新的并且可以返回,同时仍然满足一致性要求。

最佳答案

假设您有 2 个数据中心,每个数据中心都有一个单独的数据库,并且您的系统允许客户端连接到第一个或第二个数据中心。两个数据中心必须同步,因此它们之间存在网络链接。

现在假设网络链接中断,数据库之间无法再相互通信(这就是网络分区的意思)。作为应用程序开发人员,您现在做什么?

你基本上有两个选择:

1) 使系统可用,根据 CAP 定义,这意味着:

Every request received by a non-failing [database] node in the system must result in a [non-error] response

请注意,在我们的示例中,两个节点均未发生故障(它们已启动并正在运行)。

换句话说,你可以允许来自两个数据中心的所有客户端写入和读取数据,但你失去了一致性(见下面的定义),因为在一个数据库中的写入在另一个数据库中是不可见的。

2) 使系统保持一致(注意它与 ACID 一致性无关),按照 CAP 的定义,这意味着线性化,简单来说就是如果发生了写入,它必须被整个系统看到(既不是节点必须看到以前的状态)。

在我们的例子中,这意味着您需要拒绝来自其中一个数据中心的读写操作,因此只有一个数据中心可以运行。这样的系统根本不是无用的,并且您不会失去分区容错性,因为您可以将所有客户端重新路由到操作数据库。

围绕 CAP 定理存在很多混淆,我建议您阅读 Martin Kleppmann 的一篇优秀博客文章,它帮助我对这个主题有了很多了解: https://martin.kleppmann.com/2015/05/11/please-stop-calling-databases-cp-or-ap.html

关于distributed-system - CAP 定理中可用性的一致性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46597181/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com