databricks - 在 DBFS 上输入文件的正确路径-6ren

databricks - 在 DBFS 上输入文件的正确路径

转载作者：行者123 更新时间：2023-12-04 12:53:07

26

4

我将文件上传到 DBFS:

/FileStore/shared_uploads/name_surname@xxx.xxx/file_name.csv

我试图通过 Pandas 访问它们，但我总是收到此类文件不存在的信息。
我尝试使用以下路径:

/dbfs/FileStore/shared_uploads/name_surname@xxx.xxx/file_name.csv
dbfs/FileStore/shared_uploads/name_surname@xxx.xxx/file_name.csv
dbfs:/FileStore/shared_uploads/name_surname@xxx.xxx/file_name.csv
./FileStore/shared_uploads/name_surname@xxx.xxx/file_name.csv

有趣的是，当我通过 dbutils.fs.ls 检查它们时，我看到了所有文件。
我找到了这个解决方案，我已经尝试过了: Databricks dbfs file read issue
将它们移动到一个新文件夹:

dbfs:/new_folder/

我试图从这个文件夹访问它们，但仍然对我不起作用。唯一的区别是我将文件复制到了不同的地方。
我也检查了文档: https://docs.databricks.com/data/databricks-file-system.html
我使用 Databricks 社区版。
我不明白我做错了什么以及为什么会这样。
我没有其他想法。

最佳答案

/dbfs/挂载点在 Community Edition 上不可用(这是一个已知限制)，因此您需要执行链接答案中的建议:

dbutils.fs.cp(
  'dbfs:/FileStore/shared_uploads/name_surname@xxx.xxx/file_name.csv', 
  'file:/tmp/file_name.csv')

然后使用 /tmp/file_name.csv作为 Pandas 函数的输入参数。如果您需要向 DBFS 写入一些内容，那么您可以采取其他方式 - 写入本地文件 /tmp/... ，然后将该文件复制到 DBFS。

关于databricks - 在 DBFS 上输入文件的正确路径，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/69594933/

26

4

0

文章推荐： rmarkdown 执行变量内的代码

文章推荐： python - 为什么 KNeighborsClassifier 总是预测相同的数字？

文章推荐： Julia:在给定的时间内运行外部进程并捕获其输出

azure - Databricks DBFS 文件浏览器未显示某些 DBFS 根位置
我有一个新的 Azure Databricks 实例，正在对其进行一些实验。根据 Databricks 文档，我 activated the DBFS File Browser在管理控制台中。但是，
azure - Databricks DBFS 文件浏览器未显示某些 DBFS 根位置
我有一个新的 Azure Databricks 实例，正在对其进行一些实验。根据 Databricks 文档，我 activated the DBFS File Browser在管理控制台中。但是，
azure - DBFS AZURE Databricks - 文件存储和 DBFS 的差异
我正在使用带有 ADLS 存储层的 Azure Databricks。我怀疑 DBFS 和 Filestore 之间有什么区别？知道吗，Filestore 中可以存储的文件的最大大小是多少？我们可以将
azure - 数据库 DBFS
我需要了解一些有关 Databricks DBFS 的信息。用简单的基本术语来说，它是什么，它的目的是什么以及它允许我做什么？关于 databricks 的文档，说的是这个效果.. “DBFS
database - 您将如何构建数据库文件系统 (DBFS)？
数据库文件系统是一种文件系统，它是数据库而不是层次结构。最初不是一个太复杂的想法，但我想我会问是否有人考虑过他们如何做这样的事情？一个简单的计划可能会遗漏哪些问题？我对实现的第一个猜测是类似于 Lin
Azure databricks DBFS 挂载不可见
我正在尝试使用以下代码使用 python 笔记本将 azure 存储 blob 安装到 azure Databricks 中。 mount_name = '/mnt/testMount' if not
databricks - 在 DBFS 上输入文件的正确路径
我将文件上传到 DBFS: /FileStore/shared_uploads/name_surname@xxx.xxx/file_name.csv 我试图通过 Pandas 访问它们，但我总是收到此
bash - 在集群范围的初始化脚本中从 dbfs 复制文件
我想在 Azure Databricks 群集上尝试群集范围的初始化脚本。我正在努力查看哪些命令可用。基本上，我在 dbfs 上有一个文件，希望在集群启动时将其复制到本地目录 /tmp/config
bash - 在集群范围的初始化脚本中从 dbfs 复制文件
我想在 Azure Databricks 群集上尝试群集范围的初始化脚本。我正在努力查看哪些命令可用。基本上，我在 dbfs 上有一个文件，希望在集群启动时将其复制到本地目录 /tmp/config
pyspark - 从数据 block DBFS 中删除记录
我正在尝试删除位于 DBFS 中的 Databricks Delta Lake 中的一些记录。我只有路径。没有保存为表格，有没有办法从增量文件中删除记录？谢谢最佳答案更新的答案: Delta L
azure - Azure Databricks DBFS 数据集存储在哪里？
我将数据上传到Azure Databricks，可以看到DBFS列表中有数据集，但在Databricks所属的资源组中找不到任何数据集。 Azure Databricks DBFS 数据集存储在哪里？
azure - Azure Databricks DBFS 数据集存储在哪里？
我将数据上传到Azure Databricks，可以看到DBFS列表中有数据集，但在Databricks所属的资源组中找不到任何数据集。 Azure Databricks DBFS 数据集存储在哪里？
azure - Azure Databricks 中 DBFS 的数据大小限制是多少
我读到here AWS Databricks 上单个文件的存储限制为 5TB，我们可以存储任意数量的文件那么同样的限制也适用于 Azure Databricks 吗？或者，Azure Databric
Databricks:在 cron 上删除根 DBFS 上的集群日志和修订
在调查高数据 block 费用时，我惊奇地发现，其中很多实际上是一个自动创建的存储帐户，具有 GRS 复制到另一个包含大量日志文件(TB 上 TB 数据)的区域例如: dbutils.fs.ls('d
python-3.x - 在Databricks(DBFS)中递归列出目录和子目录的文件
使用python/dbutils，如何在Databricks文件系统(DBFS)中递归显示当前目录和子目录的文件。最佳答案关于 dbutils.fs.ls (和 %fs 魔法命令)的令人惊讶的事情
curl - Databricks:将 dbfs:/FileStore 文件下载到我的本地机器？
我正在使用 saveAsTextFile() 将 Spark 作业的结果存储在文件夹 dbfs:/FileStore/my_result 中。我可以使用 Web 浏览器访问不同的“part-xxxx
使用 python 的 Azure Databricks dbfs
在azure databricks中，通过简单地添加两个点，我可以得到不同的dbfs目录列表结果。谁能向我解释一下为什么会发生这种情况？最佳答案使用 dbutils，您只能使用“dbfs:/”路径
azure - 非法参数异常 : File must be dbfs or s3n:/
dbutils.fs.mount( source = f"wasbs://{blob.storage_account_container}@{blob.storage_account_name}.
hadoop - HDFS 和 Databricks DBFS 之间的主要区别是什么？
每一个我都很理解。但主要区别是什么？两者都将数据持久保存在磁盘上吗？如果我将非分布式系统挂载到数据 block DBFS 会怎样？最佳答案我认为在 HDFS 中，数据保存在本地服务器上，但在
java - 如何从分布式环境访问位于 S3 存储桶中的 DBFS 文件？
我的文件存储在 prod 和 test 环境中的 S3 存储桶中。我的代码将在两个环境的分布式系统中执行。我想从 DBFS 访问文件，因为 DBFS 由 S3 支持，并且它的存储桶安装是指向 S3 位

首页

博学

6Ren·AI

商城

databricks - 在 DBFS 上输入文件的正确路径