- r - 以节省内存的方式增长 data.frame
- ruby-on-rails - ruby/ruby on rails 内存泄漏检测
- android - 无法解析导入android.support.v7.app
- UNIX 域套接字与共享内存(映射文件)
我正在使用 Kafka,我们有一个构建容错系统的用例,在该系统中甚至不应遗漏任何一条消息。所以这是问题所在:如果由于任何原因(ZooKeeper 宕机、Kafka 代理宕机等)发布到 Kafka 失败,我们如何才能稳健地处理这些消息并在事情再次备份后重播它们。正如我所说,我们甚至不能承受单个消息失败。另一个用例是我们还需要知道在任何给定时间点有多少消息由于任何原因而未能发布到 Kafka,例如计数器功能,现在这些消息需要再次重新发布。
解决方案之一是将这些消息推送到某个数据库(例如 Cassandra,其中写入速度非常快,但我们还需要计数器功能,我猜 Cassandra 计数器功能不是那么好,我们不想使用它。)它可以处理这种负载,还可以为我们提供非常准确的计数器设施。
这个问题更多是从架构的角度出发,然后是使用哪种技术来实现这一点。
PS:我们处理一些像 3000TPS 这样的地方。因此,当系统开始失败时,那些失败的消息会在很短的时间内快速增长。我们正在使用基于 Java 的框架。
感谢您的帮助!
最佳答案
Kafka之所以以分布式、容错的方式构建,就是为了像你这样处理问题,核心组件的多次故障应该避免服务中断。为避免 Zookeeper 宕机,请至少部署 3 个 Zookeeper 实例(如果这是在 AWS 中,则将它们部署在可用区域之间)。为避免代理失败,部署多个代理,并确保您在生产者 bootstrap.servers
属性中指定多个代理。为确保 Kafka 集群已将您的消息写入持久庄园,请确保在生产者中设置了 acks=all
属性。这将在所有同步副本确认消息的接收时确认客户端写入(以吞吐量为代价)。您还可以设置排队限制,以确保如果对代理的写入开始备份,您可以捕获异常并处理它并可能重试。
使用 Cassandra(另一个经过深思熟虑的分布式容错系统)来“暂存”您的写入似乎并没有为您的架构增加任何可靠性,但确实增加了复杂性,而且 Cassandra 并不是为了成为一个消息队列的消息队列,我会避免这种情况。
正确配置后,Kafka 应该可以处理您所有的消息写入并提供适当的保证。
关于java - 如何以稳健的方式处理kafka发布失败,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40183133/
我们正在使用 VSTS 构建和发布通过 Xamarin 创建的 iOS 和 Android 应用程序。通过 VSTS 将 Android 应用发布到商店相对简单。有人可以指导我或提供一些如何通过 VS
我一直在研究 Spring Social Facebook 的 publish(objectId, connectionName, data) API ,但不确定此 API 的用法(遗憾的是,由于缺少
我正在使用 django viewflow 创建一个发布流程: 用户创建对象 它进入审核流程,其状态为待处理(公众不可见) 经过审核和批准后,就会发布并公开可见。 如果用户编辑同一实体,则会再次进入审
我正在尝试进行 API 调用,并且 API 需要格式为 XML: Security GetSessionInfo 999999999999 0 2 {
我已经查看了所有 StackOverflow,但没有找到适合我的案例的解决方案我有 405 HttpStatusCode 调用 API/Regions/Create 操作这是我的 baseContro
如果我切换到新版本的SpringBoot,我在启动应用程序时会得到上面的错误信息。这是为什么? 最美好的祝愿史蒂文 pom.xml 4.0.0 de.xyz.microservice spring
我有一个场景,页面导航是从一个域到另一个域完成的。例如,导航是从 http://www.foo.com到 http://www.bar.com在 JavaScript 中单击按钮 重定向时,我需要将用
这半年来一直深耕包头,这个城市比较不错,但是推进项目的难度确实挺大的。与开发产品相比,后者更省心。但是光研发产品,没有项目
我正在阅读有关 Github 版本 的信息,它似乎很适合您的项目。因为我们需要决定将哪些功能用于生产,哪些不用于。 我无法理解的部分是,master 和 release 分支如何在其中发挥作用。 Sh
我将一些代码推送到远程存储库,然后在 GitHub 上创建了第一个版本,并将其命名为 'v0.0.1'。 GitHub 现在显示我现在有一个版本,并且还在“标签”中显示我有一个标签 “v0.0.1”。
如果我有一个具有以下文件/文件夹结构的 GitHub 存储库 github.com/@product/template: /build /fileA /fileB /src /genera
我有一个 Maven 多模块项目。 当代码开发完成后,我们想在 Jenkins 中编写一个分支构建作业,它分支代码,增加主干中的 pom 版本,并删除 -SNAPSHOT 来自分支中的 pom 版本。
我有一个非常大的集合(约 40000 个文档,包含约 20-25 个字段,包括包含一组约 500 个项目的数组字段)和约 2000 个订阅者(他们现在只是机器人)。 因此,当用户订阅整个集合(不包括服
如果我正在使用消息队列构建一个包含数十个发布者/订阅者的系统,那么我似乎有一些网络配置选项: 我可以拥有一个所有机器都使用的集群代理 - 每台机器都没有本地队列 我可以在每台机器上本地安装代理,并使用
我正在使用 Flash Develop,并且创建了一个 ActionScript 3.0 项目。它启动并读取一个 xml 文件,其中包含图像的 url。我已将 url 保留在与 swf 相同的文件夹中
如果我在一个句子中使用 alloc 和 retain 声明一个 NSArray 那么我应该释放 NSArray 对象两次(即[arrayObject release] 2次)? 最佳答案 如果您在同一
我正在尝试在 Node 中实现发布/订阅模式,但不使用 Redis。功能应该是相同的;您可以发布到 channel ,订阅 channel 并收听数据(如果您已订阅);以下是 Redis 功能: pu
编辑:这个问题、一些答案和一些评论,包含很多错误信息。见 how Meteor collections, publications and subscriptions work准确理解发布和订阅同一服
我正在开发一款 DirectX 游戏,我发现在发布版本中我的平均帧速率为 170fps,但是在调试版本中我的帧速率约为 20fps。 我想知道发布和调试版本之间的巨大差异是否正常,特别是因为在调试中我
是否有办法回滚 Windows Azure 网站和 SQL 部署/发布? 我发布了一个网站,现在它导致了很多错误,我想回到之前的状态并进一步处理代码。 这可能吗? 最佳答案 如果您使用 Git 或 T
我是一名优秀的程序员,十分优秀!