gpt4 book ai didi

python-3.x - Pyspark:如何将 spark 数据帧转换为 json 并将其另存为 json 文件?

转载 作者:行者123 更新时间:2023-12-03 16:24:16 25 4
gpt4 key购买 nike

我正在尝试将我的 pyspark sql 数据帧转换为 json,然后另存为文件。

df_final = df_final.union(join_df)

df_final 包含这样的值:

enter image description here

我试过这样的事情。但它创建了一个无效的 json。
df_final.coalesce(1).write.format('json').save(data_output_file+"createjson.json", overwrite=True)

{"Variable":"Col1","Min":"20","Max":"30"}
{"Variable":"Col2","Min":"25,"Max":"40"}

我预期的文件应该有如下数据:
[
{"Variable":"Col1",
"Min":"20",
"Max":"30"},
{"Variable":"Col2",
"Min":"25,
"Max":"40"}]

最佳答案

对于 pyspark您可以直接将数据帧存储到 json 文件中,无需将数据帧转换为 json。

df_final.coalesce(1).write.format('json').save('/path/file_name.json')

并且您仍然想将数据帧转换为 json 然后您可以使用 df_final.toJSON() .

关于python-3.x - Pyspark:如何将 spark 数据帧转换为 json 并将其另存为 json 文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53426420/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com