gpt4 book ai didi

java - 具有合成时间戳的 Spark 窗口函数?

转载 作者:塔克拉玛干 更新时间:2023-11-02 20:01:30 27 4
gpt4 key购买 nike

假设我有一个包含记录的数据文件,其中每条记录都有一个时间戳,如下所示:

foo,bar,blaz,timestamp1
foo,flibble,baz,timestamp2
bleh,foo,gnarly,timestamp3
...

我想使用 Spark 以需要使用 window() 函数的方式处理它。有什么方法可以读取这些记录,并将每个记录放入 DStream,以便我的代码明确提供 window() 函数使用的时间戳(在这种情况下基于解析输入记录中的时间戳字段)?

最佳答案

不是的,默认的Spark处理是基于系统时间的。如果您想使用事件时间构建窗口。我建议您使用“updateStateByKey”函数来处理更新函数中的逻辑。

关于java - 具有合成时间戳的 Spark 窗口函数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28571416/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com