pyspark - Databricks PySpark 作业不断被取消-6ren

pyspark - Databricks PySpark 作业不断被取消

转载作者：行者123 更新时间：2023-12-01 04:31:10

我在 Azure 上使用 Databricks 笔记本，我有一个完美的 Pyspark 笔记本，昨天一整天都运行良好。但是在一天结束时，我注意到我在之前知道可以正常工作的代码上遇到了一些奇怪的错误:org.apache.spark.SparkException: Job aborted due to stage failure: Task from application
但因为太晚了，我把它留到今天。今天我尝试创建一个新的集群并运行代码，这次它一直说我的工作被“取消”

事实上，我只是尝试运行 1 行代码:

filePath = "/SalesData.csv"

甚至被取消了。

编辑:

这是来自 Azure 的 std 错误日志:

OpenJDK 64-Bit Server VM warning: ignoring option MaxPermSize=512m; support was removed in 8.0
/databricks/python/lib/python3.5/site-packages/IPython/config/loader.py:38: UserWarning: IPython.utils.traitlets has moved to a top-level traitlets package.
  from IPython.utils.traitlets import HasTraits, List, Any, TraitError
Fri Jan  4 16:51:08 2019 py4j imported
Fri Jan  4 16:51:08 2019 Python shell started with PID  2543  and guid  86405138b8744987a1df085e4454bb5d
Could not launch process The 'config' trait of an IPythonShell instance must be a Config, but a value of class 'IPython.config.loader.Config' (i.e. {'HistoryManager': {'hist_file': ':memory:'}, 'HistoryAccessor': {'hist_file': ':memory:'}}) was specified. Traceback (most recent call last):
  File "/tmp/1546620668035-0/PythonShell.py", line 1048, in <module>
    launch_process()
  File "/tmp/1546620668035-0/PythonShell.py", line 1036, in launch_process
    console_buffer, error_buffer)
  File "/tmp/1546620668035-0/PythonShell.py", line 508, in __init__
    self.shell = self.create_shell()
  File "/tmp/1546620668035-0/PythonShell.py", line 617, in create_shell
    ip_shell = IPythonShell.instance(config=config, user_ns=user_ns)
  File "/databricks/python/lib/python3.5/site-packages/traitlets/config/configurable.py", line 412, in instance
    inst = cls(*args, **kwargs)
  File "/databricks/python/lib/python3.5/site-packages/IPython/terminal/embed.py", line 159, in __init__
    super(InteractiveShellEmbed,self).__init__(**kw)
  File "/databricks/python/lib/python3.5/site-packages/IPython/terminal/interactiveshell.py", line 455, in __init__
    super(TerminalInteractiveShell, self).__init__(*args, **kwargs)
  File "/databricks/python/lib/python3.5/site-packages/IPython/core/interactiveshell.py", line 622, in __init__
    super(InteractiveShell, self).__init__(**kwargs)
  File "/databricks/python/lib/python3.5/site-packages/traitlets/config/configurable.py", line 84, in __init__
    self.config = config
  File "/databricks/python/lib/python3.5/site-packages/traitlets/traitlets.py", line 583, in __set__
    self.set(obj, value)
  File "/databricks/python/lib/python3.5/site-packages/traitlets/traitlets.py", line 557, in set
    new_value = self._validate(obj, value)
  File "/databricks/python/lib/python3.5/site-packages/traitlets/traitlets.py", line 589, in _validate
    value = self.validate(obj, value)
  File "/databricks/python/lib/python3.5/site-packages/traitlets/traitlets.py", line 1681, in validate
    self.error(obj, value)
  File "/databricks/python/lib/python3.5/site-packages/traitlets/traitlets.py", line 1528, in error
    raise TraitError(e)
traitlets.traitlets.TraitError: The 'config' trait of an IPythonShell instance must be a Config, but a value of class 'IPython.config.loader.Config' (i.e. {'HistoryManager': {'hist_file': ':memory:'}, 'HistoryAccessor': {'hist_file': ':memory:'}}) was specified.

最佳答案

我和我的团队在安装 azureml['notebooks'] 后遇到了这个问题。 Python 打包到我们的集群中。安装似乎有效，但我们在尝试运行代码单元时收到“已取消”消息。

我们还在日志中收到了一个类似于这篇文章中的错误:

The 'config' trait of an IPythonShell instance must be a Config, 
  but a value of class 'IPython.config.loader.Config'...

似乎某些 Python 包可能与此 Config 对象冲突，或者不兼容。我们卸载了库，重新启动了集群，一切正常。希望这对某人有所帮助:)

关于pyspark - Databricks PySpark 作业不断被取消，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54021634/

文章推荐： java - 使用带有非 ASCII 密码的 PKCS#12 证书

文章推荐： IIS 上的 WordPress 301 重定向

文章推荐： jquery - 在多个div上设置相同的高度

iphone - 如何准备应用程序以提交到应用程序商店？我*不断*收到代码签名错误？
如果这不是一个错误，那就是另一个错误。如果不是那样的话，那就是别的东西了。我觉得我的项目已经改变了很多，现在只是试图解决代码签名问题，结果一切都搞砸了。我严格按照说明进行操作，但出现错误，例如当前的“
c++ - 我的 makefile 不断 self 编译；我究竟做错了什么？
我不确定是否有一些我不知道的内置变量或规则，或者 make 是否有问题，或者我只是疯了。对于我的一个项目，我有一个如下的 makefile: CC=g++ CFLAGS=-O3 `libpng-co
jQuery/CSS3 - 不断 3d 翻转 5 div？
我有大约 10 个 div，它们必须不断翻转，每个 div 延迟 3 秒这个 codrops 链接的最后一个效果是我正在寻找的，但无需单击 div http://tympanus.net/Devel
php - jQuery 不断 ping 以获取 Ajax 响应
我如何使用 jQuery 持续运行 PHP 脚本并每秒获取响应，以及将鼠标上的少量数据发送到同一脚本？我真的必须添加一些随机扩展才能让这么简单的计时器工作吗？最佳答案 To iterate is
java - REQUIRES_NEW 内的 REQUIRES_NEW 内的 REQUIRES_NEW ... 不断
JBoss 4.x EJB 3.0 我见过如下代码(大大简化): @Stateless @TransactionAttribute(TransactionAttributeType.NOT_SUPPO
git - 不能忽略 .idea/workspace.xml - 不断 pop
使用 PHPStorm，我试图忽略每次尝试进行 git 提交时 pop 的 workspace.xml。我的 .gitignore 看起来像: /.idea/ .idea/workspace.xml

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

pyspark - Databricks PySpark 作业不断被取消