gpt4 book ai didi

attributes - Pyspark 'PipelinedRDD' 对象没有属性 'show'

转载 作者:行者123 更新时间:2023-12-03 08:15:54 24 4
gpt4 key购买 nike

一世
我想找出 df 中所有不在 df1 中的项目,以及 df1 中但不在 df 中的项目

    df =sc.parallelize([1,2,3,4 ,5 ,6,7,8,9])
df1=sc.parallelize([4 ,5 ,6,7,8,9,10])
df2 = df.subtract(df1)
df2.show()
df3 = df1.subtract(df)
df3.show()

只是想检查结果,看看我是否很好地理解了该功能。
但是得到了这个错误
'PipelinedRDD' 对象没有属性 'show'
有什么建议吗?

最佳答案

print(df2.take(10))
df.show()仅适用于 Spark 数据帧

关于attributes - Pyspark 'PipelinedRDD' 对象没有属性 'show',我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41154721/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com