azure - FileUtils 写入方法在 Azure Databricks 上不起作用-6ren

azure - FileUtils 写入方法在 Azure Databricks 上不起作用

转载作者：行者123 更新时间：2023-12-03 00:55:31

29

4

我在 Databricks 集群的驱动程序上写入文件(作为临时文件)时遇到问题。我公司的 Azure Databricks 上有一个 scala 笔记本，其中包含以下代码行:

val xml: String = Controller.requestTo(url)
val bytes: Array[Byte] = xml.getBytes

val path: String = "dbfs:/data.xml"
val file: File = new File(path)
FileUtils.writeByteArrayToFile(file, bytes)

dbutils.fs.ls("dbfs:/")

val df = spark.read.format("com.databricks.spark.xml")
                   .option("rowTag", "generic:Obs")
                   .load(path)

df.show

file.delete()

但是它崩溃并显示org.apache.hadoop.mapreduce.lib.input.InvalidInputException:输入路径不存在:dbfs:/data.xml。当我在 dbfs 的根目录上运行 ls 时，它不会显示文件 data.xml，所以对我来说 FileUtils 没有完成它的工作。更让我陷入麻烦的是，以下代码在同一个集群、同一个 Azure 资源组、同一个 Databricks 实例上运行时有效，但在另一个笔记本中运行:

val path: String = "mf-data.grib"
val file: File = new File(path)
FileUtils.writeByteArrayToFile(file, bytes)

我尝试重新启动集群，从路径中删除“dbfs:/”，将文件放入dbfs:/tmp/目录中，使用FileUtils.writeStringToFile(file, xml 、StandardCharsets.UTF_8) 而不是 FileUtils.writeByteArrayToFile 但这些解决方案都不起作用，即使将它们组合起来也是如此。

最佳答案

如果您使用本地 API，例如 File，则需要使用相应的 local file access - 您需要使用 /dbfs/ 作为路径前缀，而不是使用 dbfs:/，因此您的代码将如下所示:

val file: File = new File(path.replaceFirst("dbfs:", "/dbfs")

关于azure - FileUtils 写入方法在 Azure Databricks 上不起作用，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/70187049/

29

4

0

文章推荐： Azure 应用服务托管内部技术

文章推荐： javascript - 使用vue + webpack加载图片

Ruby:FileUtils.cp 截断文件； FileUtils.mv 不是吗？
这很奇怪……我想不明白为什么会这样。我有一个文件夹，里面装满了各种 CoffeeScript、SASS、HTML 和 XML 文件。我有一个 Ruby 脚本，可以将它们全部提取、编译并将它们缩小到
ruby - 无法运行 FileUtils.copy，因为我在需要 'fileutils.rb' 时收到错误
这个问题不太可能帮助任何 future 的访问者；它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况相关，这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用，visit
fileutils - Apache Commons IO FileUtils 列表文件 : how to get list of files with no extension?
我正在尝试使用 org.apache.commons.io.FileUtils.listFiles() 获取没有扩展名的文件列表，如下所示 http://www.avajava.com/tutoria
java - FileUtils.write写入速度
我正在尝试从 mysql 读取并将结果写入 txt 文件。如您所见，我使用 Apache 的 Commons IO。结果集包含推文，下面的每个 sql 查询几乎返回 725 行以写入 txt 文件。我
Ruby FileUtils.mv 无效的多字节字符
我使用 FileUtils.mv 像这样移动文件夹: FileUtils.mv("/home/sean/_site/", "/home/sean/projects/_site/") 它的返回inval
java - 无法使用 FileUtils 复制文件
我正在尝试将文件从一个目的地复制到另一个目的地。我无法理解为什么会发生错误。如有任何帮助，我们将不胜感激。 public class FileSearch { public void find
java - 无法使用 FileUtils 删除临时文件夹
我正在开发一个 Java 8 应用程序，该应用程序下载目录/文件列表并将它们存储在生成的 Temp 目录(%LocalAppData%/Temp/ 中的目录)中。下载完成后，会生成一个 XML 文件并
java - 为什么使用 FileUtils.forceMkdir？
Apache commons-io 中的 FileUtils.forceMkdir 代替 JRE 中内置的 File.mkdirs 有何用途？ forceMkdir 的文档是 Makes a dire
java - FileUtils.readFileToString() 如何处理换行符？
我正在用java编写一个程序来导入用户输入的文本文件，使用两个关键字对其进行加密，并将输出写入一个新的文本文件。我正在使用 FileUtils.readFileToString() 将文本文件读入字
java - 如何使用 FileUtils 对将文件保存到磁盘进行单元测试？
我知道之前已经有人问过这个变体。但是，我的功能之一是使用 Common's FileUtils 。这里，它只需要 File 对象和 String。有什么方法可以对其进行单元测试吗？最佳答案当然。
java - FileUtils.listFiles 从列表中排除特定的文件扩展名
我使用此代码以递归方式从给定目录获取所有文件。 List fileList = (List) FileUtils.listFiles(new File(directoryName), null , t
java - 如何使 FileUtils 追加而不是覆盖文本文件
我正在使用以下内容将 StringBuilder 写入现有文本文件。 FileUtils.writeStringToFile(file, sb.toString(), StandardCharsets
java FileUtils.delete() 不删除文件夹
我的代码有什么问题吗？引用这个question 该文件夹未被删除。 File f = new File(directory+"\\OOO"); if (f.exists())
java - FileUtils copyURLToFile BasicAuthenication
如何使用 apache commons FileUtils 传递用于下载文件的用户凭据？我正在使用如下身份 validator ，但似乎不起作用。它甚至不会提示凭据不良，因此看起来我的身份 vali
java - Apache FileUtils 列表文件
大家好，我正在尝试获取目录列表。我正在使用 FileUtils listFiles()。我想做这样的事情:listFiles(File,IOFileFilter,false)。我真正的问题是如何从
java - 尝试使用 FileUtils 下载文件
我正在使用这个 atm: package com.obisdian.downloader; import java.io.BufferedWriter; import java.io.File; im
java - FileUtils.iterateFiles 忽略大小写
我需要按扩展类型和忽略大小写模式在目录和子目录中查找文件，这是我的代码: String[] patron = {"doc", "xls", "ppt"}; Iterator iter = FileU
java - 使用 FileUtils 下载时的进度条
我正在尝试使用 commons.io Apache 库从 URL 下载一个大文件。这是我的代码: InputStream stream = new URL(CLIENT_URL).openS
java - FileUtils.deleteDirectory 尝试删除以句点结尾的目录
我有一个目录，我在其中以编程方式(在Java中)进行递归解压缩(这似乎有效)，但最终我留下了一个包含很多子目录和文件的目录。每次运行此方法时，我都想从头开始，因此我总是删除临时目录中存在的文件夹及其剩
java - 资源目录上的 FileUtils.listFiles()
在我的项目中，我有一个 resources 目录，里面有一个 my_directory。 my_directory 包含文本文件。我想循环这个目录: URL resource = Resources

首页

博学

6Ren·AI

商城

azure - FileUtils 写入方法在 Azure Databricks 上不起作用