gpt4 book ai didi

scala - Spark RDD 将一行数据映射为多行

转载 作者:行者123 更新时间:2023-12-01 10:40:00 28 4
gpt4 key购买 nike

我有一个包含如下数据的文本文件:

Type1 1 3 5 9
Type2 4 6 7 8
Type3 3 6 9 10 11 25

我想将其转换为具有如下行的 RDD:
1 Type1
3 Type1
3 Type3
......

我从一个案例类开始:
MyData[uid : Int, gid : String]

spark和scala的新手,我似乎找不到这样做的例子。

最佳答案

好像你想要这样的东西?

rdd.flatMap(line=>{
val splitLine = line.split(' ').toList
splitLine match{
case (gid:String) :: rest => rest.map(x:String =>MyData(x.toInt, gid))
}
}

关于scala - Spark RDD 将一行数据映射为多行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31008169/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com