gpt4 book ai didi

spark-streaming - Spark streaming 24X7 updateStateByKey 问题

转载 作者:行者123 更新时间:2023-12-01 11:36:32 24 4
gpt4 key购买 nike

我正在 24/7 全天候运行 Spark 流并使用 updateStateByKey是否可以 24/7 全天候运行 Spark Streaming?如果是,updateStateByKey 不会变大,如何处理?当我们 24/7 全天候运行时,我们是否必须定期重置/删除 updateStateByKey 如果不是如何以及何时重置它?或者 Spark 以分布式方式处理?如何动态创建内存/存储。

当 updateStateByKey 增长时,我收到以下错误

Array out of bound exception

Exception while deleting local spark dir: /var/folders/3j/9hjkw0890sx_qg9yvzlvg64cf5626b/T/spark-local-20141026101251-cfb4
java.io.IOException: Failed to delete: /var/folders/3j/9hjkw0890sx_qg9yvzlvg64cf5626b/T/spark-local-20141026101251-cfb4

如何处理这个..如果有任何文档请指点我?我完全被卡住了,非常感谢任何帮助..感谢您的宝贵时间

最佳答案

在 Java 中使用 Optional.absent() 而在 Scala 中使用 None 来删除键。可以在 http://blog.cloudera.com/blog/2014/11/how-to-do-near-real-time-sessionization-with-spark-streaming-and-apache-hadoop/ 找到工作示例.

关于spark-streaming - Spark streaming 24X7 updateStateByKey 问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26570399/

24 4 0