gpt4 book ai didi

hazelcast-jet - Hazelcast Jet Cluster 进程重复

转载 作者:行者123 更新时间:2023-12-04 15:22:04 34 4
gpt4 key购买 nike

我已经部署了 3 个嵌入了 Hazelcast Jet 的 spring boot 应用程序。节点相互识别并作为集群运行。我有以下代码:从 CSV 中简单读取并写入文件。但是 Jet 将重复项写入文件接收器。准确地说,Jet 处理 CSV 中的总条目数乘以节点数。因此,如果我在源和 3 个节点中有 10 个条目,我会在接收器中看到 3 个文件,每个文件都包含全部 10 个条目。我只想处理一次记录一次。以下是我的代码:

    Pipeline p = Pipeline.create();

BatchSource<List<String>> source = Sources.filesBuilder("files")
.glob("*.csv")
.build(path -> Files.lines(path).skip(1).map(line -> split(line)));

p.readFrom(source)
.writeTo(Sinks.filesBuilder("out").build());
instance.newJob(p).join();

最佳答案

如果是共享文件系统,则 FilesourceBuilder 中的 sharedFileSystem 属性必须设置为 true

关于hazelcast-jet - Hazelcast Jet Cluster 进程重复,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63091893/

34 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com