gpt4 book ai didi

scala - Spark Scala 流式 CSV

转载 作者:行者123 更新时间:2023-12-01 00:41:21 26 4
gpt4 key购买 nike

我是 Spark/Scala 的新手。我知道如何加载 CSV 文件:

    sqlContext.read.format("csv")

以及如何读取文本流和文件流:
    scc.textFileStream("""file:///c:\path\filename""");
scc.fileStream[LongWritable, Text, TextInputFormat](...)

但如何阅读文本 CSV 格式的流 格式?谢谢,列维

最佳答案

干得好:

val ssc = new StreamingContext(sparkConf, Seconds(5))


// Create the FileInputDStream on the directory
val lines = ssc.textFileStream("file:///C:/foo/bar")

lines.foreachRDD(rdd => {
if (!rdd.isEmpty()) {
println("RDD row count: " + rdd.count())
// Now you can convert this RDD to DataFrame/DataSet and perform business logic.

}
}
})

ssc.start()
ssc.awaitTermination()
}

关于scala - Spark Scala 流式 CSV,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37526228/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com