gpt4 book ai didi

python - 在 python apache beam 中,是否可以按特定顺序编写元素?

转载 作者:行者123 更新时间:2023-11-28 18:28:39 26 4
gpt4 key购买 nike

我正在使用 Beam 处理重叠窗口上的时间序列数据。在我的管道结束时,我将每个元素写入一个文件。每个元素代表一个 csv 行,其中一个字段是关联窗口的时间戳。我想按照该时间戳的顺序编写元素。有没有办法使用 python beam 库来做到这一点?

最佳答案

虽然这不是基本分布的一部分,但您可以通过处理这些元素并将它们作为全局窗口的一部分进行排序来实现,然后再写入文件,但需要注意以下事项:

  • 窗口的全部内容需要适合内存,或者您需要将文件分块到更小的全局窗口中。
  • 如果您选择第二个选项,您需要有一个策略来将较小的窗口写入文件。

关于python - 在 python apache beam 中,是否可以按特定顺序编写元素?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39235274/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com