gpt4 book ai didi

scala - 如何将 Spark 数据框写入 xml 文件?

转载 作者:行者123 更新时间:2023-12-01 23:42:02 25 4
gpt4 key购买 nike

样本 :

scala> Frame.show()

|year| make|model| comment|blank|
|2012|Tesla| S| No comment| R|
|1997| Ford| E350|Go get one now th...| L|
|2015|Chevy| Volt| Try| M|


<item>
<'year'>2012<'/year'>
<'make'>Tesla<'/make'>
<'model'>S<'/mode'>
</item>

最佳答案

最简单的方法是使用来自 spark-xml 的 XML writer。 :

val path: String = ???
df.write.format("com.databricks.spark.xml")
.option("rootTag", "items")
.option("rowTag", "item")
.save(path)

如果由于某种原因它不符合您的需求,您可以单独转储记录和 saveAsTextFile :
def dumpXML(row: Row): String = ???
df.rdd.map(dumpXML).saveAsTextFile(path)

您可以使用例如 mapPartitions 添加根元素.

关于scala - 如何将 Spark 数据框写入 xml 文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35620822/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com