gpt4 book ai didi

java - Cloud Dataflow - 增加 JVM Xmx 值(value)

转载 作者:搜寻专家 更新时间:2023-10-31 20:27:20 25 4
gpt4 key购买 nike

我们正在尝试在云中运行 Google Cloud Dataflow 作业,但我们不断收到“java.lang.OutOfMemoryError:Java 堆空间”。

我们正在尝试处理 Big Query 表中的 6.1 亿条记录,并将处理后的记录写入 12 个不同的输出(主输出 + 11 个副输出)。

我们已尝试将实例数量增加到 64 个 n1-standard-4 实例,但问题仍然存在。

虚拟机上的 Xmx 值似乎设置为 ~4GB(-Xmx3951927296),即使实例有 15GB 内存。有什么方法可以增加 Xmx 值吗?

作业 ID 是 - 2015-06-11_21_32_32-16904087942426468793

最佳答案

您不能直接设置堆大小。然而,Dataflow 会根据机器类型调整堆大小。您可以通过设置标志“--machineType”来选择具有更多内存的机器。堆大小应随机器类型的总内存线性增加。

Dataflow 有意限制堆大小以避免对洗牌器产生负面影响。

您的代码是否显式地从内存中的多个记录中累加值?对于任何给定的记录,您认为 4GB 是不够的吗?

Dataflow 的内存要求应根据单个记录的大小和代码在内存中缓冲的数据量进行扩展。 Dataflow 的内存需求不应随着记录数的增加而增加。

关于java - Cloud Dataflow - 增加 JVM Xmx 值(value),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30795924/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com