apache-kafka - 即使生产者得到确认，Kafka 中也会发生消息丢失吗？-6ren

apache-kafka - 即使生产者得到确认，Kafka 中也会发生消息丢失吗？

转载作者：行者123 更新时间：2023-12-04 03:58:31

25

4

Kafka doc说:

Kafka relies heavily on the filesystem for storing and caching messages.

A modern operating system provides read-ahead and write-behind techniques that prefetch data in large block multiples and group smaller logical writes into large physical writes.

Modern operating systems have become increasingly aggressive in their use of main memory for disk caching. A modern OS will happily divert all free memory to disk caching with little performance penalty when the memory is reclaimed. All disk reads and writes will go through this unified cache

...rather than maintain as much as possible in-memory and flush it all out to the filesystem in a panic when we run out of space, we invert that. All data is immediately written to a persistent log on the filesystem without necessarily flushing to disk. In effect this just means that it is transferred into the kernel's pagecache.”

进一步 this article说:

(3) a message is ‘committed’ when all in sync replicas have applied it to their log, and (4) any committed message will not be lost, as long as at least one in sync replica is alive.

所以即使我用 acks=all 配置生产者(这会导致生产者在所有代理提交消息后收到确认)并且生产者收到某些消息的确认，这是否意味着他们仍然有可能丢失消息，特别是如果所有代理都出现故障并且操作系统从不刷新已提交的消息消息缓存到磁盘？

最佳答案

与 acks=all如果主题的复制因子 > 1，仍然有可能丢失已确认的消息，但可能性很小。

例如，如果您有 3 个副本(并且所有副本都是同步的)，则 acks=all ，您需要同时丢失所有 3 个代理，然后它们中的任何一个才有时间实际写入磁盘。与 acks=all ，一旦所有同步副本收到消息，就会发送确认，您可以使用 min.insync.replicas=2 确保此数字保持高位。例如。

如果您使用 rack awareness feature，您可以进一步降低出现这种情况的可能性。 (显然，经纪人实际上位于不同的机架甚至更好的数据中心)。

总而言之，使用所有这些选项，您可以充分降低丢失数据的可能性，使其不太可能发生。

关于apache-kafka - 即使生产者得到确认，Kafka 中也会发生消息丢失吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57987591/

25

4

0

文章推荐： svn - Team City VCS错误收集更改

文章推荐： apache-spark - 基于内容的大规模推荐

文章推荐： r - 从列表列表中选择列表的子集

kafka的java客户端-生产者
kafka的java客户端-生产者生产者消息发送流程发送原理在消息发送的过程中，涉及俩个线程，main线程和sender线程，在main线程中创建一个双端队列RecordAccumulator。
两端都有等待的消费者/生产者
我使用互斥体和条件编写了一个生产者/消费者程序。它使用全局 int 来生成和使用值。有 1 个消费者线程和多个生产者线程。规则: 当值太小时，消费者会等待。当值太大时，生产者就会等待。我的问题是
multithreading - 生产者-消费者使用赋值
我有兴趣发现当有多个产品和多个消费者时是否可以在不使用赋值的情况下解决生产者 - 消费者问题，即使用函数式编程风格？如何？ Producer-consumer problem 谢谢最佳答案是的，您
performance - 生产者-消费者在超同级与非超同级之间共享内存位置的延迟和吞吐量成本是多少？
单个进程中的两个不同线程可以通过读取和/或写入共享一个公共(public)内存位置。通常，这种(有意的)共享是通过使用 lock 的原子操作来实现的。 x86 上的前缀，对于 lock前缀本身(即非
c# - 生产者-消费者同步问题
我正在尝试编写一个简单的生产者-消费者应用程序，在该应用程序中，我需要从文件中读取大块数据(可能很大)，并且(出于简单测试目的)只需通过另一个线程将其写入另一个文件中即可。我尝试了很多在线资源，但是
docker - 生产者/消费者的Java代码无法在Docker安装程序中连接kafka
我已经为kafka(wurstmeister / kafka-docker)构建了一个docker镜像。在docker容器内部，我能够使用内置的shell脚本创建主题，生成消息并使用消息。现在，我正在
c++ - 生产者-消费者模型
我正在尝试模拟关于多线程的生产者-消费者模型。我们假设要遵守三个规则: 当桶装满产品时，生产者不能将产品添加到桶中。当桶为空时，消费者无法从桶中获取产品。生产和消费不能同时进行。换句话说，这两个
java - 生产者/消费者应用程序的设计
我有一个生成器应用程序，可以生成索引(将其存储在某些内存树数据结构中)。消费者应用程序将使用索引来搜索部分匹配。我不希望消费者 UI 在生产者索引数据时必须阻塞(例如通过某些进度条)。基本上，如果用
java - 生产者/消费者场景中的双向流
我正在尝试为我遇到的排队问题找到解决方案。在典型的场景中，生产者将一些东西放入队列中，而消费者将其取出。如果我们有一个也消费的生产者和一个最初从队列中取出某些内容然后将某些内容(例如结果)放回到队列中
java - 生产者/消费者死锁原因及调试
虽然以下是众所周知的话题，但我想请您提供意见。我写了一个小程序如下:所有生产者和消费者都排队。我不明白为什么会这样。什么场景下可以完全阻塞。让我们考虑一下生产者/消费者正在等待数组上的锁，以及是什么
java - 生产者-消费者在单个消费者和任意数量的生产者的情况下仅使用notify()
下面是我用于实现生产者-消费者问题的代码。使用 notifyAll() 一切正常，但是由于性能原因，我想用 notify() 替换所有出现的 notifyAll() >. 我发现通过将 notifyA
java - 生产者-消费者实现中的线程工作平衡
我有一个生产者-消费者的基本实现，如下所示: 我的问题是如何使线程数:x ~ y 来提高应用程序性能和负载平衡？有人有关键字或提示吗？预先感谢您! 最佳答案您应该能够通过 Little's La
java - 具有线程和阻塞队列的消费者-生产者
我编写了一个类“Producer”，它连续解析特定文件夹中的文件。解析的结果将存储在Consumer的队列中。 public class Producer extends Thread { p
java - 生产者-消费者线程死锁
我遇到“生产者 - 消费者任务”中可能出现死锁的问题。一切都应该按以下方式进行: 生产者应该生成 int[] 数组并将其添加到集合中消费者应该获取这些数组，将它们放入第二个集合并在输出中打印在 D
java - 生产者/消费者线程不给出结果
我正在为我的操作系统类(class)做一个 CPU 调度模拟器项目。该程序应包含两个线程:生产者线程和消费者线程。生产者线程包括在系统中生成进程的生成器和选择多个进程并将它们放入一个名为 Buffer
rabbitmq - 生产者/消费者的不同语言
我想知道是否可以通过 AMQP 和 RabbitMQ 为生产者和消费者使用不同的语言？例如:Java 用于生产者，python/php 用于消费者，还是反之？最佳答案是的，AMQP 与语言无关，
java - 生产者/消费者线程根本没有输出数据
编辑:我有一个生产者类，它将一些数据发送到 SharedBuffer 类。该数据被添加到 ArrayList 中，限制设置为 100。将数据添加到所述列表中没有问题，但消费者类无法从列表中获取任何数据
C - 生产者/消费者死锁问题
我正在尝试在有界缓冲区中使用生产者/消费者线程。缓冲区长度为 5。我有 1 个互斥体和 2 个信号量，空信号量从缓冲区大小开始，满信号量从 0 开始。当我在最后没有 sleep() 的情况下运行代码
java - 是否可以同时使用线程消费者/生产者？
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 9 年前。 Improve this ques
java - 生产者-消费者队列能够将项目移到前面
我用Java的LinkedBlockingDeque实现了生产者-消费者模式，但我遇到了一个问题，我有时想将一个项目(已经在队列中的某个位置)移动到队列的前面，以便更快地处理它。我永远不知道哪些已经排

首页

博学

6Ren·AI

商城

apache-kafka - 即使生产者得到确认，Kafka 中也会发生消息丢失吗？