- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我觉得我可能遗漏了一些非常基本的东西,但我还是会问的。
有多个分区的输入主题。我将 selectKey 用作 DSL 拓扑的一部分。 selectKey 始终返回相同的值。我的期望是,在由 selectKey() 触发的内部重新分区之后,拓扑中的下一个处理器将在同一分区上为同一键调用。然而,下一个处理器 transform() 会在不同的分区上针对相同的键调用。
拓扑:
Topology buildTopology() {
final StreamsBuilder builder = new StreamsBuilder();
builder
.stream("in-topic", Consumed.with(Serdes.String(), new JsonSerde<>(CatalogEvent.class)))
.selectKey((k,v) -> "key")
.transform(() -> new Processor())
.print();
return builder.build();
}
transform 使用的处理器类
public class Processor implements Transformer<String, CatalogEvent, KeyValue<String, DispEvent>> {
private ProcessorContext context;
@Override
public void init(ProcessorContext context) {
this.context = context;
}
@Override
public KeyValue<String, DispEvent> transform(String key, CatalogEvent catalogEvent) {
System.out.println("key:" + key + " partition:" + context.partition());
return null;
}
@Override
public KeyValue<String, DispatcherEvent> punctuate(long timestamp) {
// TODO Auto-generated method stub
return null;
}
@Override
public void close() {
// TODO Auto-generated method stub
}
}
“in-topic”有两条以随机 UUID 作为键的消息,即“8f45e552-8886-4781-bb0c-79ca98f9d927”、“a794ed2a-6f7d-4522-a7ac-27c51a64fa28”,两条消息的有效载荷相同
Processor::transform 对两个 UUID 的输出是
key:key partition: 2
key:key partition: 0
我如何更改拓扑以确保具有相同 key 的消息将到达同一分区 - 我需要它来确保具有相同 key 的消息将转到相同的本地 Kafka 存储实例(用于插入或更新)。
最佳答案
process()
和 [flat]transform[Values]()
没有自动重新分区。您将需要插入手动 repartition()
(或旧版本中的 through()
)调用以重新分区数据。如果您比较 JavaDocs(与支持自动重新分区的 groupBy()
或 join()
),您会发现它们没有提到自动重新分区。
原因是,这三个方法是处理器 API 集成到 DSL 中的一部分,因此没有 DSL 运算符。它们的语义是未知的,因此我们无法判断它们是否需要重新分区,如果 key 已更改。为避免不必要的重新分区,不执行自动重新分区。
关于apache-kafka - 使用选择键和转换在 DSL 拓扑上进行流重新分区,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54680774/
是否可以可视化kubernetes拓扑并看到它在添加/删除/链接对象时实时更新? 我在https://www.youtube.com/watch?v=38SNQPhsGBk上观看了一个视频,其中服务/
我在搜索 Rack 拓扑时发现了这个问题...可能是hadoop认证问题: 您的群集在三个不同的 Rack 中都有从属节点,并且您编写了一个 Rack 拓扑脚本,以将每台计算机分别识别为位于 Rack
我拿了sticky force layout示例并尝试添加额外链接并使用 enter() 更新布局,但随后所有链接都消失了,FireBug 也没有显示任何错误。 这些行不应该添加链接吗? graph.
我需要编写一个订单管理器,将客户(股票、外汇等)订单发送到适当的交易所。客户想要发送订单,但对 FIX 或其他专有协议(protocol)一无所知,只知道发送订单的内部(规范化)格式。我有应用程序(服
我正在尝试使用 Eclipse 在远程主机上提交 Storm 拓扑。 这是我的代码: Config conf = new Config(); conf.setDebug(false); conf.se
这是一个名为 mininet 的流行网络模拟器的拓扑文件 我创建了一个 MultiSwitch() 类,我想将其传递给我的 Topology 类以用作默认开关 有没有办法做到这一点?我对Python不
我从 cat/proc/cpuinfo 中了解到,我正在使用 Intel(R) Core(TM) i5 CPU M 560 @ 2.67GHz。但是我想知道确切的层次结构,比如有多少个套接字,每个套接
我正在学习storm。我对我们可以在 Apache Storm 上一次运行的拓扑数量有疑问。我已经在 Storm 集群上提交了两个拓扑,但一次只运行了一个拓扑。我需要杀死或停用已经存在的拓扑拓扑以运行
我正在尝试理解 topology of queues并交换 MT 在 RabbitMQ 中创建的。 我不能得到这两个陈述: we generate an exchange for each queue
我正在寻找一种方法来测试 Kafka Streams 应用程序。这样我就可以定义输入事件,测试套件会向我显示输出。 如果没有真正的 Kafka 设置,这可能吗? 最佳答案 更新 Kafka 1.1.0
我正在使用 Java 类将拓扑提交到 Storm 集群,我还计划使用 Java 类来终止拓扑。但根据 Storm documentation ,以下命令用于终止拓扑并且没有 Java 方法(这是有正当
Storm jar storm-starter-topologies-0.10.0-beta1.jar storm-starter-master.jar生产拓扑本地 我遇到了错误: Running:
我正在编写一个 dockerized Java Spring 应用程序,该应用程序使用 Apache Storm v1.1.2、Kafka v0.11.0.1、Zookeeper 3.4.6、Eure
我在 jts 拓扑库中有一些多边形。如果我想在 javafx Pane 上绘图,我会这样做: Polygon poly=new Polygon();//javafx //g is geometry
我需要在 Java GUI 应用程序中动态绘制(星形)拓扑。通过星形拓扑,我的意思是这样的: (来源:thebryantadvantage.com) 不需要太花哨,但我不想做得太丑陋和粗糙。我所说的动
我想自动化设置 Mininet 的过程虚拟机,通过 SSH 连接到 VM,在 VM 中启动 Mininet,并初始化拓扑。我需要 session 保持打开状态,以便我可以使用创建的网络向 Minine
我正在尝试重新平衡使用 KafkaSpout 的 Storm 拓扑。我的代码是: TopologyBuilder builder = new TopologyBuilder(); Pr
标题几乎说明了一切,我有一些 Storm 拓扑,我想测量它们的延迟,即来自 Kafka 的消息与最终相关执行的最后一点之间的时间量 bolt 。如果我可以深入研究结果以查看每个 bolt 之间的延迟,
假设我想让一些转换“A”可配置。此转换使用状态存储管理某些状态,并且还需要重新分区,这意味着仅在配置后才会进行重新分区。现在,如果我按照以下方式(或任何其他组合)运行应用程序 3 次(也可能是滚动升级
我目前正在尝试实现与 R 语言集成的 Storm 拓扑。 作为起点,我采用了以下项目 ( https://github.com/allenday/R-Storm ),它通过扩展 ShellBolt 类
我是一名优秀的程序员,十分优秀!