gpt4 book ai didi

csv - Python Spark-如何将空数据帧输出到 csv 文件(仅输出 header )?

转载 作者:行者123 更新时间:2023-12-04 21:32:33 25 4
gpt4 key购买 nike

我想将空数据帧输出到 csv 文件。我使用这些代码:

df.repartition(1).write.csv(path, sep='\t', header=True)

但是由于数据帧中没有数据,spark 不会将 header 输出到 csv 文件。
然后我将代码修改为:
if df.count() == 0:
empty_data = [f.name for f in df.schema.fields]
df = ss.createDataFrame([empty_data], df.schema)
df.repartition(1).write.csv(path, sep='\t')
else:
df.repartition(1).write.csv(path, sep='\t', header=True)

它有效,但我想问一下是否有更好的方法没有计数功能。

最佳答案

df.count() == 0将使您的驱动程序检索跨执行程序的所有数据帧分区的计数。

在你的情况下,我会使用 df.take(1).isEmpty ( Spark >= 2.1)。仍然很慢,但比原始 count() 更好.

关于csv - Python Spark-如何将空数据帧输出到 csv 文件(仅输出 header )?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47544557/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com