gpt4 book ai didi

azure - 使用 dbutils.fs.mv 的 Databricks 并行 mv 文件

转载 作者:行者123 更新时间:2023-12-03 03:27:15 25 4
gpt4 key购买 nike

我有 azure 存储帐户,并且在单个文件夹中有一些文件(超过数百万个文件)。我想使用 dbutils.fs.mv 到另一个文件夹。最快的方法是什么?

最佳答案

您可以尝试以下方法。

  1. azcopy正如@Kombajn zbożowy建议的.

    使用下面的示例代码。

    azcopy copy "https://rakeshgen2.blob.core.windows.net/mysource2/<SAS Key>" "https://rakeshgen2.blob.core.windows.net/targetdata/<SAS Key>" --recursive=true

    enter image description here

    目标文件:

    enter image description here

    你可以通过这个link了解有关 azcopy 性能的更多信息。

  2. 挂载后即可使用dbutils.fs.mvdbutils.fs.cp

    示例:

    try:
    dbutils.fs.mv("/mnt/mysource2/","/mnt/targetadb",recurse=True)
    except:
    pass

    enter image description here

  3. Copy activity如果您的结构中没有递归文件夹,也可能适合您。

    浏览Documentation了解复制 liveness 能和速度。

关于azure - 使用 dbutils.fs.mv 的 Databricks 并行 mv 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/75413723/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com