gpt4 book ai didi

apache-spark - Spark Streaming 不从 Windows 中的本地目录读取文件

转载 作者:行者123 更新时间:2023-12-04 05:08:42 29 4
gpt4 key购买 nike

public class StreamingWordCount implements Serializable { 

public static void main(String[] args) {

JavaStreamingContext jssc = new JavaStreamingContext("local[2]", "JavaWordCount",
new Duration(1000));
JavaDStream<String> data = jssc.textFileStream("D:/krishna/").cache();
data.foreach(new Function<JavaRDD<String>, Void>() {

public Void call(JavaRDD<String> rdd) throws Exception {
List<String> output = rdd.collect();
System.out.println("Sentences Collected from files " + output);
return null;
}
});

data.print();
jssc.start();
jssc.awaitTermination();
}
}

我在 Windows 8 上独立使用 Spark。

JavaStreamingContext 仅适用于 HDFS 目录吗?

点击输出: This is output on console, Sentence collected from files is empty. I tried changing the directory, files. But still code is not picking files. This is my first code in Spark Streaming. Kindly help.

最佳答案

将批处理时间间隔减少 5 毫秒到 10 毫秒 如果任何作业将花费超过提供的批处理时间,则 jssc.awaitTermination() 方法将等待完成挂起的作业并自动处理批处理时间。

关于apache-spark - Spark Streaming 不从 Windows 中的本地目录读取文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33585064/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com