gpt4 book ai didi

apache-spark - 为什么spark告诉我 “name ' sqlContext'未定义“,如何使用sqlContext?

转载 作者:行者123 更新时间:2023-12-04 13:26:07 31 4
gpt4 key购买 nike

我尝试运行spark-ml的示例,但是

from pyspark import SparkContext
import pyspark.sql

sc = SparkContext(appName="PythonStreamingQueueStream")
training = sqlContext.createDataFrame([
(1.0, Vectors.dense([0.0, 1.1, 0.1])),
(0.0, Vectors.dense([2.0, 1.0, -1.0])),
(0.0, Vectors.dense([2.0, 1.3, 1.0])),
(1.0, Vectors.dense([0.0, 1.2, -0.5]))], ["label", "features"])
无法运行,因为终端告诉我
NameError: name 'SQLContext' is not defined
为什么会这样呢?我该如何解决?

最佳答案

如果您使用的是Apache Spark 1.x行(即Apache Spark 2.0之前的版本),则需要访问sqlContext来访问sqlContext; IE。

from pyspark.sql import SQLContext
sqlContext = SQLContext(sc)

如果您使用的是Apache Spark 2.0,则可以直接使用 Spark Session代替。因此,您的代码将是
training = spark.createDataFrame(...)

有关更多信息,请引用 Spark SQL Programing Guide

关于apache-spark - 为什么spark告诉我 “name ' sqlContext'未定义“,如何使用sqlContext?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40580221/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com