- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在运行一些实验来测试 Apache Flink 的容错能力。我目前正在使用 HiBench 框架和为 Flink 实现的 WordCount 微型基准测试。
我注意到,如果我在执行过程中杀死了一个 TaskManager,Flink 操作符的状态会在自动“重新部署”后恢复,但是从基准测试发送到 Kafka 的许多(全部?)元组会丢失(存储在 Kafka 中但不存储在 Kafka 中)在 Flink 中接收)。
似乎在恢复之后,FlinkKafkaConsumer
(基准测试使用 FlinkKafkaConsumer08)代替了从失败前读取的最后一个偏移量开始读取,从最新的可用偏移量开始读取(丢失所有事件)在失败期间发送)。
有什么建议吗?
谢谢!
最佳答案
问题出在 HiBench 框架本身和最新版本的 Flink 上。
为了在 Kafka 消费者中使用“setStartFromGroupOffsets()”方法,我必须更新基准测试中的 Flink 版本。
关于apache-kafka - FlinkKafkaConsumer在HiBench中的容错,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49697590/
TL;DR:目前 Flink 中保证事件时间顺序的最佳解决方案是什么? 我使用 Flink 1.8.0 和 Kafka 2.2.1。我需要通过事件时间戳保证事件的正确顺序。我每 1 秒生成一次周期性水
DataStreamSink 类有一个名称字段。为什么 FlinkKafkaConsumer 和 FlinkKafkaProducer 没有相似字段?在 Flink Dashboard 中,我的接收器
一、问题描述 环境介绍: CDH6.3.1集群 Flink版本 1.9.0 Kafka版本 2.12 本地运行无问题,提交到yarn集群报错 代码: package org.example;
我是一名优秀的程序员,十分优秀!