apache-kafka - Apache Kafka 灾难恢复计划-6ren

apache-kafka - Apache Kafka 灾难恢复计划

转载作者：行者123 更新时间：2023-12-05 05:12:32

25

4

我们有 10 个应用程序服务器和 3 个 kafka 集群来支持应用程序消息传递请求。最近我们遇到了一种情况，由于网络问题，kafka 集群宕机了，整个应用程序宕机了几个小时，因为所有数据都丢失了。当我在寻找 kafka 灾难恢复计划时，发现我们应该有 -

故障转移到同一数据中心的另一个集群
故障转移到附近数据中心的另一个集群
故障转移到另一个区域数据中心的另一个集群

由于我们在拥有另一个数据中心方面存在一些限制，因此我们正在考虑采用一种方法-

所有应用服务器将数据写入文件
Filebeat读取文件并推送到kafka

如果 kafka 端出现问题，数据将在文件中可用并且可以恢复。所以，我的问题是，这种做法好吗？此架构中有任何重大问题吗？还有其他建议吗？

最佳答案

Were your kafka brokers running on separate rack server?

出于维护目的，机架服务器可能会离线几分钟。 https://kafka.apache.org/documentation/#basic_ops_racks

It is not recommended to distribute kafka-cluster on different data centers. You may start to get network related problems when you do so.

https://kafka.apache.org/documentation/#datacenters

What if entire data center is not available?

如果数据服务提供商未交付 SLA，则起诉他们。编写生产者假设经纪人可能不可用。您还可以查看 unclean leader选举。

替代策略可以是:一旦您的生产者注意到 kafka 代理没有响应。将数据放入 elasticsearch/其他数据库。这样您就可以有所依靠。

如果您正确设计了 kafka 环境，那么同步副本的最小数量和 ack=all 应该可以保证在少数代理宕机的情况下数据存在于机器上。按照设计，如果同步副本数 > 最小同步副本数；经纪人不会接受来自生产者的消息。

此外，如果数据是 mirrored across different clusters在不同的数据中心，这也会让您更有信心。

关于apache-kafka - Apache Kafka 灾难恢复计划，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54465471/

25

4

0

文章推荐： azure - Azure AD B2C 上的自定义属性为 stringCollection

文章推荐： laravel - Log Laravel 可公开访问

文章推荐： c# - Visual Studio : [CS0433] type Func 存在于和中

文章推荐： Symfony webpack encore twig 函数不起作用

计划 - eq？比较2个字符串？
我的程序有问题。我有一个比较两个字符串的条件: (if (eq? (exp1) (exp2))) 当 exp1 给我一个字符串，exp2 给我一个字符串。可以肯定的是，当我更改“eq？”时到“=”，
GWT future 计划
我们有多种主要使用 GWT 开发的产品，目前由我们的最终客户使用。想知道 GWT 的路线图。我得到了一些非官方的更新，谷歌正在将 GWT 中开发的产品转移到其他一些新技术。这是真的吗？ GWT 的长
Jenkins 定期构建 - 计划
我希望每 15 分钟定期构建一次。我在网上看过，我正在使用这个时间表:*/15 * * * * Jenkins 告诉我使用 H/15 * * * * 来平均分配负载而不是 */15 * * * * 有
计划，电话/抄送
所以我正试图在 Scheme 中找出整个 call/cc 的东西。下面是我正在使用的代码: (+ 1 (call/cc (lambda (k) (if (number? k)
计划，电话/抄送
所以我正试图在 Scheme 中找出整个 call/cc 的东西。下面是我正在使用的代码: (+ 1 (call/cc (lambda (k) (if (number? k)
Azure 计划 Web 作业有时会触发两次
我们有一个 Azure WebJob，计划在 UTC 每天上午 8:00 运行(CRON - 0 00 08 * * *)。大多数时候它都会正确触发，但有时会触发两次(第二次运行)第一次运行后约 10
terraform - 命令行参数过多 Terraform 计划
我是 Terraform 的新手。我正在尝试通过 azure 管道创建一个简单的存储帐户，但是当我运行我的管道时，我收到错误“太多命令行参数”。我很震惊，我不知道自己做错了什么。有人可以帮忙吗。这是
ballerina - 如何终止芭蕾舞 Actor 计划
我想在某些逻辑中间停止芭蕾舞 Actor 程序。如何使用代码停止 ballerina 中正在运行的程序？我正在寻找相当于 java 中的 System.exit(0) 的东西。最佳答案我相信您正在
agile - 与多层团队一起进行 Scrum 计划
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。想改进这个问题？将问题更新为 on-topic对于堆栈溢出。 8年前关闭。 Improve this qu
Azure 计划 Web 作业有时会触发两次
我们有一个 Azure WebJob，计划在 UTC 每天上午 8:00 运行(CRON - 0 00 08 * * *)。大多数时候它都会正确触发，但有时会触发两次(第二次运行)第一次运行后约 10
terraform - 命令行参数过多 Terraform 计划
我是 Terraform 的新手。我正在尝试通过 azure 管道创建一个简单的存储帐户，但是当我运行我的管道时，我收到错误“太多命令行参数”。我很震惊，我不知道自己做错了什么。有人可以帮忙吗。这是
syntax - 为什么这是合法的( Racket )计划？
我正在浏览 htdp 并在一开始的某个地方发现了这个:- Explain why the following sentences are illegal definitions: 1. (define
php - 处理续订月份的成员(member)计划
我正在使用 Laravel 开发成员(member)门户。成员(member)资格有不同的类别，例如1) 单人2) 成人3) 家庭以及不同价格的所有类型。我有一个 plans 表和 plans_s
php - 正在执行 MySQL 计划？
我使用 DreamHost 作为我的网站的服务器，并且我尝试每天、每周和每月执行某个 MySQL 查询来更改我的网站的数据库。我开始在本地主机上使用事件调度程序，然后我发现我无法在 DreamHost
bash - 每两周一次的 Crontab 计划
这周我的 crontab 作业发生了一个问题。设置如下，每两周正常运行一次，直到现在。 10 06 * * 1 test $(($(date +\%W)\%2)) -eq 0 && echo 'te
linux - 计划 cron 作业错误
编写了一个简单的脚本，它将在日志文件中写入日期时间戳，并且每次运行该脚本时，它都会附加到该日志文件中。 #!/bin/sh echo $(date) >> log.txt 当我尝试每 1 分钟安排一次
c - 不了解 PIPE 计划
我对 PIPE 的了解是它用于单向通信，它有助于在两个相关进程之间进行通信。我从一本书中得到了下面的 PIPE 编程代码示例。我正在尝试使用 printf 理解代码并在代码的每一行之后打印出所有点。但
计划， Racket 帮助。想要返回符合条件的数字
代码如下: (define make-simple-sv-num (lambda (delare) (let ((tal (random-from-to 100000 1000000)))
math - ( Racket /计划)减法产生的结果非常小
我目前正在使用“How To Design Programs”——使用 Scheme/Racket；我在 Scheme 的 R5RS 版本中遇到了一个非常奇特的功能。在进行简单的减法时，尽管使用的是
ruby - 确定 ice_cube 计划
我想确定时间表的详细信息。例如: 我有一个事件的时间表:event.schedule "Every 3 months on the 10th day of the month" 由哈希表示: {

首页

博学

6Ren·AI

商城

apache-kafka - Apache Kafka 灾难恢复计划