apache-spark - 为什么spark告诉我 “name ' sqlContext'未定义“，如何使用sqlContext？-6ren

apache-spark - 为什么spark告诉我 “name ' sqlContext'未定义“，如何使用sqlContext？

转载作者：行者123 更新时间：2023-12-04 13:26:07

31

4

我尝试运行spark-ml的示例，但是

from pyspark import SparkContext
import pyspark.sql 

sc = SparkContext(appName="PythonStreamingQueueStream")    
training = sqlContext.createDataFrame([
(1.0, Vectors.dense([0.0, 1.1, 0.1])),
(0.0, Vectors.dense([2.0, 1.0, -1.0])),
(0.0, Vectors.dense([2.0, 1.3, 1.0])),
(1.0, Vectors.dense([0.0, 1.2, -0.5]))], ["label", "features"])

无法运行，因为终端告诉我

NameError: name 'SQLContext' is not defined

为什么会这样呢？我该如何解决？

最佳答案

如果您使用的是Apache Spark 1.x行(即Apache Spark 2.0之前的版本)，则需要访问sqlContext来访问sqlContext； IE。

from pyspark.sql import SQLContext
sqlContext = SQLContext(sc)

如果您使用的是Apache Spark 2.0，则可以直接使用 Spark Session代替。因此，您的代码将是

training = spark.createDataFrame(...)

有关更多信息，请引用 Spark SQL Programing Guide。

关于apache-spark - 为什么spark告诉我 “name ' sqlContext'未定义“，如何使用sqlContext？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40580221/

31

4

0

文章推荐： phpstorm - 在PhpStorm中切换帐户

文章推荐： chart.js - 如何使用PrimeNg的宽度和高度图表？

c# - 告诉，不要问原则和密码过期
为了遵循务实的编程原则，我试图根据“告诉，不要询问”原则来决定如何处理用户密码更改。我有一个用户对象，其密码每 30 天过期一次。如果密码过期，我需要能够显示密码过期/更改密码 View 。询问对象
python - 告诉 Flask 只将上传的内容存储在内存中而不使用临时文件
我试图在接收文件时绕过任何本地存储。根据documentation ，如果“合理”，Flask 会将文件保存在内存中，否则会将它们存储在临时位置。我只找到了一种通常使用 MAX_CONTENT_LE
sas - 告诉 SAS 不要产生科学记数法
SAS 在 proc 中返回 sci-notation 意味着总和输出，我不能将其用于进一步的速率计算过程。如何抑制 SAS 产生 sci-notation，有什么想法吗？提前致谢。 “解决了一个类似
bash - 告诉 nohup 实时写入输出
当使用 nohup 时，脚本的输出会被缓冲，只有在脚本执行完毕后才会转储到日志文件 (nohup.out) 中。以接近实时的方式查看脚本输出以了解其进展情况将非常有用。有没有办法让 nohup 在脚本
angular - 告诉 Scully 忽略路由的静态页面生成？
假设我们定义了以下路由: const routes: Routes = [ { path: '', component: WelcomeComponent }, {
r - 告诉 R 使用存储在对象中的字符串作为列名
我正在尝试以下操作: a a > 1 1 > 2 2 > 3 3 我想要的是: a b > 1 1 > 2 2 > 3 3 有没有办法告诉 R 使用存储在对象( "b" )中的字符串( a
automake - 告诉 automake 在安装之前或链接之后在程序上运行一些命令
我想在安装二进制文件之前使用 automake 处理/修改它们。例如，我想将二进制文件中的符号提取到单独的文件和位置(如 this )。另一个示例是收集关键 Assets 的 md5sum 以发布报告
qt - 告诉 qmake 编译依赖库
我的应用程序有一个主要的 pro 文件，我想告诉 qmake 在与应用程序同时编译一个单独的库。该库的目录中还有一个 pro 文件。这可能吗？最佳答案将 lib 和应用程序放在单独的子目录中，并使
vim - 告诉 screen 窗口运行上一个命令
我的 vimrc 中有以下内容: nnoremap :!screen -S foo -p run -X stuff '!!^M' 但是，当单击 F1 时，出现错误:没有上一个命令。我想要的
scala - 告诉 Swagger 请求正文可以是单个对象或对象列表
我正在使用 Swagger 和 Scala 来记录我的 REST API。我想为 POST、PUT 和 DELETE 启用批量操作，并希望相同的路由接受单个对象或对象集合作为正文内容。有没有办法告诉
sas - 告诉 SAS 不要在过程流中添加新生成的表
我有一个 SAS 代码，它为我的计算创建了很多中间表。事情是，我在工作完成后并不真正关心这张 table ，我只关心决赛的结果。但是，每次我运行这段代码时，SAS 都会添加所有生成的表来做我的流程，
minify - 告诉 UglifyJS 跳过特定的代码区域
有没有办法告诉 UglifyJS 跳过特定的代码部分，也许使用这样的注释: // uglifyjs:skipStart filter = function(item){ /* some crazy f
macos - 告诉 Homebrew 软件永远不要从源代码构建
在 macOS 上通过 homebrew 安装包时，如果我的网络不稳定并且一次下载失败，homebrew 将下载源并从源开始构建。这将需要很长时间和高 CPU 使用率，这是不需要的。如何在下载失败时告
grails - 告诉 GORM 不要保留属性
有没有办法告诉 GORM 不要保留属性？我计划在我的 User 类上定义一个确认密码属性，用于验证，但不应保留。最佳答案使用 transient 关键字 GORM 可以指示不持久化特定属性。以下
jquery - 告诉 jQuery 在动画序列期间忽略点击
我正在为 jQuery 编写一个幻灯片放映应用程序(单击按钮，然后滑动浏览图像列表)，但我遇到了一个小错误，它将响应即使在动画发生时也会发出 click() 请求。我已经在使用 animate()
xcode - 告诉 Xcode 不要在项目上使用自动布局
我可以告诉 Xcode 4 我不在项目中使用自动布局吗？目前，每个新创建的 xib 都会启用自动布局，这意味着我必须在创建 xib 后手动将其关闭，而我不希望这样。最佳答案这是自动布局的问题。您
azure - 告诉 AzCopy 批处理覆盖文件？
因此，我正在使用目前手动运行的 AzCopy，但我要通过我们的一台服务器上的任务计划程序来运行它。如果我手动执行批处理文件，这会将文件从一个容器复制到另一个容器，并且可以完美运行。然而，它问我: Ov
macos - 告诉 NSDocument 该文档已被修改
我正在 OSX 中编写一个基于文档的应用程序。我发现当我更改文档的内容时，应用程序不知道文档已更改。我可以在没有警告的情况下关闭文档，这会导致我未保存的内容丢失。如何告诉 NSDocument 文档
cocoa -- 告诉 NSWindow 重新显示其内容的正确方法是什么？
根据NSWindow Class Reference ，您应该“很少需要调用”NSWindow 方法“display”或“setViewsNeedDisplay”。那么重新显示窗口内容的常用方法是什么
cocoa - 告诉 IKImageBrowserView 不要安排预加载
为了重写开源 iMedia 框架项目(目前有数十名开发人员正在使用)，我们正在切换到 IKImageBrowserView，并且在缓存方面遇到了麻烦。看来 IKImageBrowserView 喜欢

首页

博学

6Ren·AI

商城

apache-spark - 为什么spark告诉我 “name ' sqlContext'未定义“，如何使用sqlContext？