gpt4 book ai didi

apache-spark - 使用 databricks-connect 调试运行另一个笔记本的笔记本

转载 作者:行者123 更新时间:2023-12-05 03:37:00 25 4
gpt4 key购买 nike

我能够使用 visual studio code 从我的 Linux Centos VM 连接到 Azure Databricks 集群。

下面的代码甚至可以正常工作

from pyspark.sql import SparkSession

spark = SparkSession.builder.getOrCreate()

print("Cluster access test - ",spark.range(100).count())

setting = spark.conf.get("spark.master") # returns local[*]
if "local" in setting:
from pyspark.dbutils import DBUtils
dbutils = DBUtils().get_dbutils(spark)
else:
print("Do nothing - dbutils should be available already")

out = dbutils.fs.ls('/FileStore/')
print(out)

我在本地有一个笔记本,它使用 %run path/anothernotebook 运行另一个笔记本。

因为 %run 字符串被注释了 # python 没有执行它。

所以我尝试包含 dbutils.notebook.run('pathofnotebook') 但它错误地指出笔记本

Exception has occurred: AttributeError
'SparkServiceClientDBUtils' object has no attribute 'notebook'

是否可以在本地调试调用另一个笔记本的笔记本?

最佳答案

这是不可能的 - Databricks Connect 中包含的 dbutils 实现仅支持“fs”和“secrets”子命令(参见 docs)。

Databricks Connect 旨在处理本地开发的代码,而不是笔记本。如果您可以将该笔记本的内容打包为 Python 包,那么您就可以对其进行调试。

附言请注意 dbutils.notebook.run 将笔记本作为一个单独的作业执行,与 %run 相比

关于apache-spark - 使用 databricks-connect 调试运行另一个笔记本的笔记本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69488025/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com