gpt4 book ai didi

pyspark-sql - 名称错误 : name 'dbutils' is not defined in pyspark

转载 作者:行者123 更新时间:2023-12-03 15:03:21 25 4
gpt4 key购买 nike

我正在 databricks 云中运行 pyspark 作业。作为这项工作的一部分,我需要将一些 csv 文件写入数据块文件系统(dbfs),并且我还需要使用一些 dbutils native 命令,例如,

#mount azure blob to dbfs location
dbutils.fs.mount (source="...",mount_point="/mnt/...",extra_configs="{key:value}")

一旦文件被写入挂载目录,我也试图卸载。但是,当我直接在 pyspark 作业中使用 dbutils 时,它失败了
NameError: name 'dbutils' is not defined

我应该导入任何包以在 pyspark 代码中使用 dbutils 吗?提前致谢。

最佳答案

尝试使用这个:

def get_dbutils(spark):
try:
from pyspark.dbutils import DBUtils
dbutils = DBUtils(spark)
except ImportError:
import IPython
dbutils = IPython.get_ipython().user_ns["dbutils"]
return dbutils

dbutils = get_dbutils(spark)

关于pyspark-sql - 名称错误 : name 'dbutils' is not defined in pyspark,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50813493/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com