gpt4 book ai didi

python - 如何在 pyspark 中将具有空值的数据帧写入 CSV

转载 作者:行者123 更新时间:2023-12-04 12:04:01 24 4
gpt4 key购买 nike

我正在使用以下代码写入 CSV 文件。

df.coalesce(1).write.format("com.databricks.spark.csv").option("header", "true").option("nullValue"," ").save("/home/user/test_table/")

当我执行它时,我收到以下错误:

java.lang.UnsupportedOperationException: CSV data source does not support null data type.



有人可以帮忙吗?

最佳答案

我遇到了同样的问题(没有将该命令与 nullValue 选项一起使用),我通过使用 fillna 解决了它方法。
而且我还意识到fillna 不适用于_corrupt_record ,所以我放弃了,因为我不需要它。

df = df.drop('_corrupt_record')
df = df.fillna("")
df.write.option('header', 'true').format('csv').save('file_csv')

关于python - 如何在 pyspark 中将具有空值的数据帧写入 CSV,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42090853/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com