java - Hazelcast Jet 丢弃空聚合结果-6ren

java - Hazelcast Jet 丢弃空聚合结果

转载作者：行者123 更新时间：2023-11-30 10:16:34

26

4

我有一个可能有空结果的滑动窗口和自定义聚合累加器。什么是丢弃此类“空”聚合累加器以免进入接收器的正确方法？

        Pipeline pipeline = Pipeline.create();
        pipeline.drawFrom(Sources.<Long, Foo>map("map"))
                .map(Map.Entry::getValue)
                .addTimestamps(Foo::getTimeMillisecond, LIMIT)
                .window(WindowDefinition.sliding(100, 10))
                .aggregate(FooAggregateOperations.aggregateFoo(), (s, e, r) -> {
                    return String.format("started: %s\n%s\nended: %s\n", s, r, e);
                })
                .drainTo(Sinks.files(sinkDirectory));

如您所见，聚合器返回字符串:

public class FooAggregateOperations {

    public static AggregateOperation1<Foo, FooAccumulator, String> aggregateFoo() {
        return AggregateOperation
                .withCreate(FooAccumulator::new)
                .andAccumulate(FooAggregateOperations::accumulate)
                .andCombine(FooAggregateOperations::combine)
                .andDeduct(FooAggregateOperations::deduct)
                .andFinish(FooAccumulator::getResult);
    }
}

问题基本上是，在继续与其他结果合并/扣除或冲入接收器之前，如何丢弃可忽略的窗口/聚合结果？

最佳答案

要过滤掉空的聚合结果，您可以使用以下方法:

    Pipeline pipeline = Pipeline.create();
    pipeline.drawFrom(Sources.<Long, Foo>map("map"))
            .map(Map.Entry::getValue)
            .addTimestamps(Foo::getTimeMillisecond, LIMIT)
            .window(WindowDefinition.sliding(100, 10))
            .aggregate(FooAggregateOperations.aggregateFoo(),
                    (s, e, r) -> tuple3(s, e, r))
            .filter(t -> !isEmpty(t.f2()))
            .map(t -> String.format("started: %s\n%s\nended: %s\n", t.f0(), t.f2(), t.f1()))
            .drainTo(Sinks.files("sinkDirectory"));

它所做的是将聚合结果存储在一个临时元组中，然后应用过滤和最终映射。

我还创建了一个 issue on GitHub我们将考虑在聚合操作中支持这种行为。

关于java - Hazelcast Jet 丢弃空聚合结果，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50013276/

26

4

0

文章推荐： javascript - 如何修复 Prototype 与 Highchart 的冲突？

文章推荐： swift - 照片框架 : contentMode within RequestImageForAsset method

文章推荐： swift - 0 和文本框文本之间的随机数

文章推荐： java - 多态 PApplet 处理 NullPointerException

hazelcast - Hazelcast 客户端线程安全吗？
我在 docs 中找不到这个或 javadocs : 我是否需要为每个线程创建一个客户端，或者是由以下人员创建的客户端: client = HazelcastClient.newHazelcastCl
hazelcast - Hazelcast 中的分区是如何工作的？
据我所见，Hazelcast 的应用最常见于具有 50 多个节点的架构中。在 1 到 4 节点架构上使用 Hazelcast 是否有意义？如果是，我应该遵循的关于分区和 hazelcast 实例的最佳
hazelcast - Hazelcast 是否支持默认缓存配置
在 hazelcast 文档中有一些对名为“default”的缓存的简短引用 - 例如，此处: http://docs.hazelcast.org/docs/3.6/manual/html-singl
hazelcast - Hazelcast 中的同步复制
我们正在针对我们的一个用例评估 Hazelcast，我对 Hazelcast 中的复制有疑问。在 http://docs.hazelcast.org/docs/latest-development/
hazelcast - Hazelcast 会懒惰地创建主题吗？
Hazelcast 是否会延迟创建主题。在下面的示例中，我们调用 getTopic('default')。如果默认主题不存在，Hazelcast 会自动创建它吗？这是否意味着没有理由初始化宇宙中所有
hazelcast - hazelcast 使用什么算法来寻找主节点
我正在研究hazelcast用于以多播方式查找主节点的算法。首先我找到了查找主节点的函数:com.hazelcast.cluster.MulticastJoiner.findMasterWithMul
hazelcast - Hazelcast 中的驱逐政策之间的差异
我正在查看 Hazelcast 的文档，我注意到驱逐政策的差异，并且我注意到其中一个我并不完全理解。 map_size_per_jvm: Max map size per JVM. partition
java - 要存储在 hazelcast 中用于缓存的 IMap 中的数据存储在 hazelcast 服务器中还是存储在 hazelcast 实例运行的位置？
我已经编写了用于缓存的 hazelcast 缓存框架，并通过构造函数注入(inject)专门编写了一个用于缓存的 hazelcast 服务器。只是想知道 IMap 对象存储在哪里？它是在我的 haze
hazelcast - 了解 Hazelcast 成员加入或离开集群会影响哪些数据
我们的服务器端解决方案利用 Hazelcast 提供的分布式数据结构来提供与居住在特定集群成员上的实体相关的可用状态。当一个集群成员加入或离开集群时，我们需要让其他集群节点知道“发生了什么变化”:例
hazelcast - 如何在 Hazelcast 集群中配置复制缓存？
我的 Spring 应用程序由十几个微服务组成。每个微服务都提供不经常更改的数据。为了减少微服务之间的通信，我正在考虑开始使用 Hazelcast。我的想法是每个微服务都会嵌入 Hazelcast。
hazelcast - 在 hazelcast 中批量加载数据的最佳方法
我需要使用 csv/平面文件在 hazelcast 中加载 3 亿条记录(每条记录 60KB)。以最快的方式加载所有这些数据的最佳方法是什么？我可以逐条读取记录并在 hazelcast 中执行 map
hazelcast - 使用 Hazelcast 作为服务目录？
我正在探索使用 Hazelcast(或任何其他缓存框架)在集群内宣传服务的概念。理想情况下，当集群成员离开时，其服务(或宣传它们的对象)应从缓存中删除。这全部可能吗？最佳答案这是肯定有可能的。
hazelcast - 关闭 hazelcast 客户端连接
我刚刚开始使用 hazelcast [3.3.1]。按照 hazelcast 应用程序和客户端教程，我创建了一个 hazelcast 应用程序实例和一个客户端(使用 eclipse IDE)。从客户
hazelcast - 减少 Hazelcast 线程的数量
出于测试目的，我想在单个节点上运行多个 Hazelcast 实例。 Hazelcast 假定它正在管理整个节点，因此它创建了足够多的线程来完全(实际上是过度)加载所有内核。在我的 8 核 Linux
hazelcast - 为什么 Hazelcast 尝试连接到另外两个端口
我使用 IP 127.0.0.1 和端口 5701 启动 Hazelcast。为什么它尝试连接另外两个端口 5702 和 5703？它们的用途是什么，为什么无法连接？以下是我以编程方式配置的方式:
java - 使用 jar 将 Hazelcast Mancenter 连接到外部 Hazelcast 服务器，而不是设置 hazelcast 服务器配置
我使用启动了 hazelcast 服务器 java -jar hazelcast-3.10.1/lib/hazelcast-3.10.1.jar 服务器启动于 Members {size:1
hazelcast - Hazelcast 是否遵循 JSR-107
最近阅读 JSR-107 和 JCache。想知道 Hazelcast 或 Ehcache 是否遵循此 JSR？最佳答案 JSR107 (JCache) 取得了良好的进展，我们已经通知规范委员会
hazelcast - 配置两节点 hazelcast 集群 - 避免多播
背景 Hazelcast 集群的两个节点，每个节点都位于一个离散的子网上，因此多播不适合也不适合节点定位。我想使用最简单的 XML 配置文件(例如 hazelcast.xml)来配置 Hazelca
java - Hazelcast:如何刷新 Hazelcast 实例？
我正在创建一个始终启动并运行的服务(ReST)。因此，在这个服务中，我从 spring 上下文中调用 init 方法，该方法会访问数据库并将所需的数据加载到 hazelcast 实例中。现在我必须确
java - Hazelcast:如何在 hazelcast 中使用列表作为键
当我的java服务启动时，我从数据库中获取字符串列表，因此将它们缓存在hazelcast中，键是字符串列表，值(例如)100。可能有多个具有不同值的列表。这个想法是，下次当我的方法接收 String

首页

博学

6Ren·AI

商城

java - Hazelcast Jet 丢弃空聚合结果