gpt4 book ai didi

java - Spark 流式传输和模拟 hdfs

转载 作者:可可西里 更新时间:2023-11-01 15:49:23 25 4
gpt4 key购买 nike

需要为 Spark 流代码实现测试。此特定代码使用 this library 在单独的 jvm 中运行上述应用程序的输入是 hdfs。我已经像这样启动了 MiniDFSCluster example (java version) 但我不认为它会起作用,因为它们在两个不同的 JVM 中。

如果我要成功测试 spark 流代码,模拟 hdfs 输入的最佳方法是什么。

我大致解释了上面的场景。真正的要求是实现一个成功的cucumber测试。

最佳答案

您可以在本地模式下运行 Spark 并指定诸如“file:///foo/bar”之类的路径,而不是尝试模拟 hdfs - 然后将使用本地文件系统而不是 hdfs。

关于java - Spark 流式传输和模拟 hdfs,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51832343/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com