gpt4 book ai didi

scala - 是否可以将 Spark ML CrossValidatorModel 应用到 Flink Streaming 数据流中?

转载 作者:行者123 更新时间:2023-11-30 09:35:58 25 4
gpt4 key购买 nike

Flink 是流式处理的明显选择,但是 Spark 已经成熟了 ML pipeline,是否可以在 Spark 中训练模型,将其另存为 CrossValidatorModel code> 并部署到 Flink 中的流数据?全部在 scala 中?

最佳答案

Flink 目前(2017 年 3 月,Flink 1.2)不支持为流提供机器学习模型。不过,这是社区当前正在讨论的一个功能。

欢迎在 Flink 中提交 JIRA 来请求该功能。

在 Flink 正式支持之前,可能还有其他方法将模型加载到 Flink 中。 (免责声明:我真的不是 Spark ML 方面的专家)。从 JavaDocs 来看,CrossValidatorModel 似乎有一个方法 write(),它返回一个带有 save(String path) 的 MLWriter 方法。

您可以在 Spark 中构建模型,使用 MLWriter 保存模型,然后使用 MLReader 在 Flink 中再次加载模型并在流中使用它。

关于scala - 是否可以将 Spark ML CrossValidatorModel 应用到 Flink Streaming 数据流中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42816766/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com