gpt4 book ai didi

pyspark - 如何使用 Pyspark 将数据帧保存到 pickle 文件

转载 作者:行者123 更新时间:2023-12-02 10:42:48 24 4
gpt4 key购买 nike

我必须将数据帧保存到 Pickle 文件,但它返回错误

df.saveAsPickleFile(path)

属性错误:“Dataframe”对象没有属性“saveAsPickleFile”

最佳答案

saveAsPickleFileRDD 的方法,而不是数据帧的方法。

请参阅此文档: http://spark.apache.org/docs/latest/api/python/pyspark.html?highlight=pickle

所以你可以调用:

df.rdd.saveAsPickleFile(filename)

要从文件加载它,请运行:

pickleRdd = sc.pickleFile(filename).collect()
df2 = spark.createDataFrame(pickleRdd)

关于pyspark - 如何使用 Pyspark 将数据帧保存到 pickle 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49559004/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com