attributes - Pyspark 'PipelinedRDD' 对象没有属性 'show'-6ren

attributes - Pyspark 'PipelinedRDD' 对象没有属性 'show'

转载作者：行者123 更新时间：2023-12-03 08:15:54

一世
我想找出 df 中所有不在 df1 中的项目，以及 df1 中但不在 df 中的项目

    df =sc.parallelize([1,2,3,4 ,5 ,6,7,8,9])
    df1=sc.parallelize([4 ,5 ,6,7,8,9,10])
    df2 = df.subtract(df1)
    df2.show()
    df3 = df1.subtract(df)
    df3.show()

只是想检查结果，看看我是否很好地理解了该功能。
但是得到了这个错误
'PipelinedRDD' 对象没有属性 'show'
有什么建议吗？

最佳答案

print(df2.take(10))

df.show()仅适用于 Spark 数据帧

关于attributes - Pyspark 'PipelinedRDD' 对象没有属性 'show'，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41154721/

文章推荐： javascript - 我的 ng-view 与 index.html 页面 angularjs 无限循环

文章推荐： sql-server-2005 - 在try…catch中告诉SQL Server错误是 “handled”

文章推荐： javascript - 即使使用切片，数组的副本也会更改原始数组

文章推荐： javascript - 从本地服务器访问本地网络上的客户端打印机

pyspark: 'PipelinedRDD' 对象不可迭代
我收到此错误，但我不知道为什么。基本上我从这段代码中出错了: a = data.mapPartitions(helper(locations)) 其中数据是 RDD，我的助手定义为:
attributes - Pyspark 'PipelinedRDD' 对象没有属性 'show'
一世我想找出 df 中所有不在 df1 中的项目，以及 df1 中但不在 df 中的项目 df =sc.parallelize([1,2,3,4 ,5 ,6,7,8,9]) df1=
python - 如何从 pyspark.rdd.PipelinedRDD 中过滤掉值？
我有一个名为 myRDD 的 pyspark.rdd.PipelinedRDD。这是其示例内容: [((111, u'BB', u'A'), (444, u'BB', u'A')), ((222,
python - “PipelinedRDD”对象在 PySpark 中没有属性 'toDF'
我正在尝试加载 SVM 文件并将其转换为 DataFrame，以便可以使用 Spark 的 ML 模块 (Pipeline ML)。我刚刚在 Ubuntu 14.04 上安装了新的 Spark 1.5
python - 需要 RDD 实例但返回类 'pyspark.rdd.PipelinedRDD'
您好，我在 Notebooks 中有这段代码，正在托盘中编写 python spark: mydataNoSQL.createOrReplaceTempView("mytable") spark.

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

attributes - Pyspark 'PipelinedRDD' 对象没有属性 'show'