apache-kafka - Kafka消费者订阅多个主题时接收消息的顺序-6ren

apache-kafka - Kafka消费者订阅多个主题时接收消息的顺序

转载作者：行者123 更新时间：2023-12-03 23:53:45

27

4

我有一个调查多个主题的消费者。对于这个问题，我限制了每个主题一个分区。假设当消费者开始轮询时，每个主题都有一些数据。
读取顺序是什么？

是循环赛吗？它是从第一个在下一个之前读取的吗？我用 consumer.poll(N)进行投票。

最佳答案

排序比较复杂。这是 Kafka 2.6 的工作原理:

当您将主题分区分配给消费者时，这些分区将保存在哈希表中，因此顺序将是稳定的，但不一定是您使用的

当您调用 Consumer.poll(N)它返回所有排队的消息，但最多返回 max.poll.records (见下文)

当没有任何内容入队时，您分配的所有主题分区将按 Kafka 节点进行分区，该主题分区的领导者所在的位置

这些列表中的每一个都在获取请求中发送到每个相应的节点

每个节点最多返回 fetch.max.bytes (或至少一条消息，如果有的话)

节点将使用来自请求分区的消息填充这些字节，始终从第一个

开始

如果当前分区中没有消息了，但还有字节要填充，则移动到下一个分区，直到没有消息或缓冲区已满

节点还可以决定停止使用当前分区并继续使用下一个分区，即使当前分区中仍有可用消息

客户端/消费者收到缓冲区后，将其拆分为CompletedFetches , 其中一个 CompletedFetch包含缓冲区中一个主题分区的所有消息

那些CompletedFetches已入队(它们可能包含 0 条消息或 1000 条或更多)。会有一个CompletedFetch对于每个请求的主题分区

因为对节点的所有请求都是并行运行的，但只有一个队列，CompletedFetches与原始分配顺序相反，/topic 分区可能会在最终结果中混淆

入队CompletedFetches逻辑上被压扁成一个大队列

Consumer.poll(N)最多将读取和出列max.poll.records从那个扁平的大队列

在记录返回给 poll 的调用者之前，开始对所有节点的另一个 fetch 请求，但这一次，所有已经在扁平化队列中的主题分区都被排除在外

这适用于所有 future poll来电

在实践中，这意味着您不会挨饿，但您可能会收到来自一个主题的大量消息，然后才能获得下一个主题的大量消息。
在消息大小为 10 字节的测试中，从一个主题读取了大约 58000 条消息，然后从下一个主题读取了大致相同的数量。
所有主题都预先填充了 100 万条消息。
因此，您将有一种批量循环。

关于apache-kafka - Kafka消费者订阅多个主题时接收消息的顺序，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53149012/

27

4

0

文章推荐： python-3.x - 文档字符串中的python注释

文章推荐： Karate - 匹配两个动态响应

文章推荐： google-cloud-platform - 谷歌云功能超时设置不起作用

kafka的Java客户端-消费者
kafka的Java客户端-消费者一、kafka消费方式 pull（拉）模式：consumer采用从broker中主动拉取数据。Kafka 采用这种方式 push（推）模式：Kafka没有采用这种方
具有多线程的Python生产者/消费者
我编写这个小应用程序是为了解决 Python 中的经典生产者/消费者问题。我知道我可以使用线程安全的队列机制来解决这个问题，但我有兴趣自己解决这个问题来学习。 from threading impor
消费者/生产者程序卡住了
下面是一个示例消费者/生产者模型的代码: int buffer[MAX]; int fill_ptr = 0; int use_ptr = 0; int count = 3; void put(int
消费者-生产者问题
我的消费者、生产者程序有问题，它似乎可以加载，但返回段错误。我已经尝试了一切来修复它，但仍然失败!将不胜感激任何帮助。笔记;代码真的很多，semaphore.h的代码都在里面，有谁想测试一下。其余代码
填充所有缓冲区的算法生产者-消费者
我正在阅读著名的操作系统概念书(Avi Silberschatz、Peter Baer Galvin、Greg Gagne)第 9 版:http://codex.cs.yale.edu/avi/os-
c# - 具有节流持续时间和批量消费的异步生产者/消费者
我正在尝试构建一个服务，为许多异步客户端提供队列以发出请求并等待响应。我需要能够通过每 Y 个持续时间的 X 个请求来限制队列处理。例如:每秒 50 个 Web 请求。它用于第 3 方 REST 服务
c# - 拥有资源的生产者-消费者
我正在尝试使用一组资源来实现生产者/消费者模式，因此每个线程都有一个与之关联的资源。例如，我可能有一个任务队列，其中每个任务都需要一个 StreamWriter写出它的结果。每个任务还必须有参数传
Azure Eventhub 消费者
为什么我们需要 Azure 存储帐户上的 blob 容器用于 Eventhub 消费者客户端(我使用的是 python)。为什么我们不能像在 Kafka 中那样直接使用来自 Eventhub(Kafk
java - 区间分区的生产者-消费者
我有一个有趣的生产者-消费者衍生产品需要实现，但我无法理解它的算法。因此，每个生产者都会“产生”给定范围(最小值，最大值)之间的数字，这对除以给定“商”给出了相同的提醒。对于消费者来说也是如此。额外
java - 如何使用自动线程管理在Java中实现生产者/消费者
我需要实现一种生产者/消费者方案，出于性能原因，消费者尝试在一批中处理许多工作项(每个工作项都会耗尽工作队列)。目前，我只是创建固定数量的相同工作人员，它们在循环中的同一队列上工作。由于其中一些可能
Azure Eventhub 消费者
为什么我们需要 Azure 存储帐户上的 blob 容器用于 Eventhub 消费者客户端(我使用的是 python)。为什么我们不能像在 Kafka 中那样直接使用来自 Eventhub(Kafk
java - Java中的复合生产者-消费者
我的关系必须按如下方式运作；线程 A 向线程 B 发布一些更改，线程 B 接受该更改并将其发布到线程 C。问题是生产者-消费者，我使用 BlockingQueue 仅用两个实体来实现它没有问题。我怎
java - 使用java同步理解生产者-消费者
我一直在研究 PC 问题，以了解 Java 同步和线程间通信。使用底部的代码，输出为 Producer produced-0 Producer produced-1 Producer produced
java - 使用同步的生产者-消费者
我编写了代码来实现生产者-消费者问题，它似乎工作正常，不需要同步。这可能吗？如何测试代码并检查它是否确实正常工作？我如何知道是否会发生死锁？现在，我没有跳出循环(即生产者不断插入，消费者不断在无限循
java - java线程生产者-消费者
我必须完成一项练习，我必须使用至少一个生产者线程和 x 个消费者线程的生产者/消费者模式在我的文件夹路径中查找“.java”文件。生产者消费者级:首先，当生产者完成查找文件时，我尝试通过设置从 tr
c - 消费者/生产者任务的解决方案
我被分配了一项类(class)作业来实现消费者/生产者问题的解决方案，该解决方案使用单个生产者、单个消费者和循环缓冲区。这应该用 C 语言编写。不幸的是，我们没有获得任何学习 Material ，并
c - 具有有限缓冲区的生产者/消费者
有人可以检查我的代码并告诉我是否走在正确的轨道上。我似乎有点迷失了。如果您看到我的错误，请告诉我它们。我想做的是使用我自己的信号量以及 GCD 来解决有界缓冲区问题。提前致谢.. sema.c v
消费者-生产者，断言失败
我要处理有界缓冲区、生产者消费者问题，只能修改 prod 和 cons 函数。此代码仅在一个消费者和生产者线程上运行，不会出现任何问题。但对于每个都有多个，迟早总会给我带来同样的问题: p5p1:
c# - 异步生产者/消费者
我有一个从多个线程访问的类的实例。此类接受此调用并将元组添加到数据库中。我需要以串行方式完成此操作，因为由于某些数据库约束，并行线程可能会导致数据库不一致。由于我不熟悉 C# 中的并行性和并发性，所
java - 具有批量和刷新功能的生产者/消费者
我正在尝试编写一个批量邮件服务，它有两种方法: add(Mail mail):可以发送邮件，由Producers调用 flushMailService():刷新服务。消费者应该获取一个列表，并调用另一

首页

博学

6Ren·AI

商城

apache-kafka - Kafka消费者订阅多个主题时接收消息的顺序