gpt4 book ai didi

scala - 如何删除 spark 输出中的 compactbuffer

转载 作者:行者123 更新时间:2023-12-04 18:00:46 27 4
gpt4 key购买 nike

下面是我在 spark shell 中运行的程序,但是当我在 HDFS 中保存输出时,我得到的输出是 compactbuffer。如何删除 spark 输出中的 compactbuffer。

程序:

val a=sc.textFile("/datagen_10.txt")

val b=a.map(p=>(p.split(",")(1),p.split(2))

val c=sc.textFile("/drug.txt")

val d =c.map(p=>(p.split(",")(1),p.split(",")(0)))

val e=b.cogroup(d)

e.saveAsTextfile("/cogroup")

输出:

(avil,(CompactBuffer(Brandon Buckner, Veda Hopkins, Mara Higgins, Sybill 

Crosby, Ivan Hale),CompactBuffer(1)))

(metacin,(CompactBuffer(Len Burgess),CompactBuffer(2)))

(paracetamol,(CompactBuffer(Zia Underwood, Austin Mayer, Tyler Rosales, Alika

Gilmore),CompactBuffer(3)))

最佳答案

您将手动创建输出字符串,例如:

e.map{case (k, (xs, ys)) => 
s"""($k, ((${xs.mkString(",")}), (${ys.mkString(",")}))"""}

关于scala - 如何删除 spark 输出中的 compactbuffer,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35714827/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com