java - Kafka Broker 偏移/日志保留和消费者偏移在最早模式下重置-6ren

java - Kafka Broker 偏移/日志保留和消费者偏移在最早模式下重置

转载作者：行者123 更新时间：2023-11-30 01:57:36

问题描述:

我们的 Kafka 消费者(在 Spring Boot 2.x 中开发)正在执行几天。当我们重新启动这些消费者时，该主题的所有消息都会再次被消费，但仅限于特定条件下。

条件:

我们假设代理/主题配置(log.retention.*、offsets.retention.*)和消费者配置(auto.offset.*)的组合。重置 = 最早)导致此行为。
显然我们不能将consumer设置为“latest”，因为如果consumer停止并且有新消息到达，当consumer再次启动时，这些消息将不会被消费。

问题:

避免这种情况的正确设置是什么？
在上一个 Kafka Broker 版本 (2.x) 中，log.retention.* 和 offsets.retention.* 的默认值是相同的 ( https://cwiki.apache.org/confluence/display/KAFKA/KIP-186%3A+Increase+offsets+retention+default+to+7+days )

这个新的配置设置可以解决问题吗？

消费者配置(auto.commit在 Spring Cloud Stream 框架上委托(delegate)):

           auto.commit.interval.ms = 100
           auto.offset.reset = earliest
           bootstrap.servers = [server1:9092]
           check.crcs = true
           client.id = 
           connections.max.idle.ms = 540000
           enable.auto.commit = false
           exclude.internal.topics = true
           fetch.max.bytes = 52428800
           fetch.max.wait.ms = 500
           fetch.min.bytes = 1
           group.id = consumer_group1
           heartbeat.interval.ms = 3000
           interceptor.classes = null
           internal.leave.group.on.close = true
           isolation.level = read_uncommitted
           key.deserializer = class org.apache.kafka.common.serialization.ByteArrayDeserializer
           max.partition.fetch.bytes = 1048576
           max.poll.interval.ms = 300000
           max.poll.records = 500
           metadata.max.age.ms = 300000
           metrics.recording.level = INFO
           metrics.sample.window.ms = 30000
           partition.assignment.strategy = [class org.apache.kafka.clients.consumer.RangeAssignor]
           receive.buffer.bytes = 65536
           reconnect.backoff.max.ms = 1000
           reconnect.backoff.ms = 50
           request.timeout.ms = 305000
           retry.backoff.ms = 100
           value.deserializer = class org.apache.kafka.common.serialization.ByteArrayDeserializer

经纪人配置:

           log.retention.ms = 86400000
           log.retention.minutes = 10080
           log.retention.hours = 168
           log.retention.bytes = -1

           offsets.retention.ms = 864000000
           offsets.retention.minutes = 14400
           offsets.retention.hours = 240 

           unclean.leader.election.enable = false
           log.cleaner.enable = true
           auto.leader.rebalance.enable = true
           leader.imbalance.check.interval.seconds = 300
           log.retention.check.interval.ms = 300000
           log.cleaner.delete.retention.ms = 604800000

感谢和问候

最佳答案

您是对的，您遇到此问题的原因是 log.retention.* 和 offsets.retention.* 的值不同(分别为 7 天和 1 天) Kafka 2.0之前版本请查看description here 。这是由于很少有消息进入您的主题，并且偏移数据已经过期。

您的短语并不完全正确显然我们无法将消费者设置为“最新”。如果您在不到 1 天前(例如几小时前)收到最后一条消息，您可以安全地将 auto.offset.reset 值更新为 latest，并使用相同的群组 ID (或application.id)。在这种情况下，您不会丢失消息。

作为另一个选项，您可以将特定主题的日志保留值更改为 1 天。您也可以更新值 offsets.retention.*，但您需要从性能角度对其进行测试，它可能会降低。

关于java - Kafka Broker 偏移/日志保留和消费者偏移在最早模式下重置，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53851114/

文章推荐： c++ - 不同编译器中的输出行为

文章推荐： java - 使用处理 3.3.7 的 textSize() 的最大值

文章推荐： java - 字符串启动 : UriComponentsBuilder toString

node.js - Chrome 的跟踪事件分析工具中的自上而下(树)、自上而下(重)和自下而上(重)有什么区别
我正在尝试使用谷歌浏览器的 Trace Event Profiling Tool分析我正在运行的 Node.js 应用程序。选择点样本后，我可以在三种 View 之间进行选择: 自上而下(树) 自上而
android - 重 ContentProvider 查询和 ListView
对于一个可能是菜鸟的问题，我们深表歉意，但尽管在 SO 上研究了大量教程和其他问题，但仍找不到答案。我想做的很简单:显示一个包含大量数据库存储字符串的 Android ListView。我所说的“很
css - 基础 5 div 重
我已经开始了一个新元素的工作，并决定给 Foundation 5 一个 bash，看看它是什么样的。在创建带有水平字段的表单时，我在文档中注意到的第一件事是它们使用大量 div 来设置样式。所以我在下
.net - 重 CPU 负载下的跨线程 BeginInvoke 阻塞
我有一个 Windows 窗体用户控件，其中包含一个使用 BeginInvoke 委托(delegate)调用从单独线程更新的第 3 方图像显示控件。在繁重的 CPU 负载下，UI 会锁定。当我附加
javascript - 什么是测试 Dom 重 js 的好方法？
我有一堆严重依赖dom元素的JS代码。我目前使用的测试解决方案依赖于 Selenium ，但 AFAIK 无法正确评估 js 错误(addScript 错误不会导致您的测试失败，而 getEval 会
Java Swing 重/慢 paintComponent - 有什么建议吗？
我正在制作一款基于滚动 2D map /图 block 的游戏。每个图 block (存储为图 block [21][11] - 每个 map 总共 231 个图 block )最多可以包含 21 个
javascript - 在网页上 - 如何显示(轻)图像并在客户端下载后者时将其替换为(重)图像？
考虑到以下情况，我是前端初学者: 某个 HTML 页面应该包含一个沉重的图像(例如 - 动画 gif)，但我不想强制客户缓慢地等待它完全下载才能享受一个漂亮的页面，而是我更愿意给他看一个轻量级图像(例
python - 重 I/O 和 python 多处理/多线程
我正在设计一个小软件，其中包括: 在互联网上获取资源，一些用户交互(资源的快速编辑)，一些处理。我想使用许多资源(它们都列在列表中)来这样做。每个都独立于其他。由于编辑部分很累，我想让用户(可能
c# - 重 I/O 操作中的 Parallel.ForEach 与异步 For 循环
我想比较两个理论场景。为了问题的目的，我简化了案例。但基本上它是您典型的生产者消费者场景。 (我关注的是消费者)。我有一个很大的Queue dataQueue我必须将其传输给多个客户端。那么让我们
python - K 重 CV 的变体，其中 size(test_set) > N/K
我有一个二元分类问题，标签 0 和 1(少数)存在巨大不平衡。由于测试集带有标签 1 的行太少，因此我将训练测试设置为至少 70-30 或 60-40，因此仍然有重要的观察结果。由于我没有过多地衡量准

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

java - Kafka Broker 偏移/日志保留和消费者偏移在最早模式下重置