gpt4 book ai didi

google-cloud-dataflow - SDK 版本 0.4.150414 损坏的作业

转载 作者:行者123 更新时间:2023-12-01 11:33:40 25 4
gpt4 key购买 nike

从 Maven 中提取了最新的 SDK 版本 (0.4.150414),但我们的作业现在失败了。

我们已经将其追溯到我们的一个类中使用的 HashMap 的反序列化,并由 ParDo 转换引用。

观察:

  • 在本地运行和在云。
  • 在调用 processElement 之前正确填充 HashMap
  • processElement 方法中放置断点显示 HashMap 具有不同的对象 ID(这必须来自反序列化原始 HashMap),但它现在是空的,即所有元素都已丢失。
  • 我们回滚到版本 0.3.150326,它在该版本上运行良好。

最新版本的 SDK 中的序列化/反序列化功能有什么变化吗?

如果您需要,很乐意将我们的代码发送到反馈电子邮件。

最佳答案

在传递给 ParDo.of 时,最新版本进行了更改以克隆 DoFn。如果多次使用 DoFn 并在两次使用之间进行修改,这会导致更好的行为。

如果在将 DoFn 传递给 ParDo.of 之后填充 HashMap 字段,就会发生您描述的问题。

您可以通过在 ParDo.of 处设置断点并检查那里的 DoFn 状态来确认这一点。要解决此问题,请在调用 ParDo.of 之前初始化该字段。

希望这对您有所帮助!

关于google-cloud-dataflow - SDK 版本 0.4.150414 损坏的作业,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29786791/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com