gpt4 book ai didi

scala - 如何在apache spark中使用kafka主题中的scala读取json数据

转载 作者:行者123 更新时间:2023-12-04 10:36:03 24 4
gpt4 key购买 nike

我是新的 Spark ,你能否让我知道如何使用 apache spark 中 kafka 主题中的 scala 读取 json 数据。

谢谢。

最佳答案

最简单的方法是使用 Spark 附带的 DataFrame 抽象。

val sqlContext = new SQLContext(sc)
val stream = KafkaUtils.createDirectStream[String, String, StringDecoder, StringDecoder](
ssc, kafkaParams, Set("myTopicName"))

stream.foreachRDD(
rdd => {
val dataFrame = sqlContext.read.json(rdd.map(_._2)) //converts json to DF
//do your operations on this DF. You won't even require a model class.
})

关于scala - 如何在apache spark中使用kafka主题中的scala读取json数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35424724/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com