gpt4 book ai didi

python - RDD.take 不起作用

转载 作者:太空宇宙 更新时间:2023-11-04 03:15:15 24 4
gpt4 key购买 nike

当我在 spark 中输入以下命令时:

textFile = sc.textFile("README.md")

textFile.take(3)

它会输出:

[u'# Apache Spark', u'', u'Spark is a fast and general cluster computing system for Big Data. It provides']

但是,当我想使用 spark-submit 加载一个 python 文件时:

from pyspark import SparkContext

logFile = "/home/sydridgm/Downloads/spark-1.6.1-bin-hadoop2.4/README.md"
sc = SparkContext("local", "Simple App")
logData = sc.textFile(logFile).cache()

logData.take(3)

它不会输出任何东西。我有点困惑。谁能解释一下?提前致谢。

最佳答案

关于这一点,shell 环境和普通应用程序之间的区别在于 shell 总是在标准输出上打印出您的命令的结果。例如,如果你创建一个 RDD,你会看到 PythonRDD,当你使用 take 时,它​​会打印 take 的结果。

提交申请时,您需要自己打印出来:

print(rdd.take(3))

关于python - RDD.take 不起作用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36512512/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com