gpt4 book ai didi

azure - 将数百万个文件从根 AZStorageBlob 复制到子文件夹

转载 作者:行者123 更新时间:2023-12-02 11:20:31 25 4
gpt4 key购买 nike

我有多个 Azure 存储 blob 容器,每个容器都有超过 100 万个 JSON 文件(包括根)。无法使用(不令人震惊),因此尝试使用数据工厂使用文件中的时间戳将它们移动到多个文件夹,以创建 YYYY-MM-DD/HH 文件夹设置作为分区系统。但我尝试过的每种方法都因超时/太多项目限制而失败。需要打开每个文件,获取时间戳,并使用它使用时间戳数据将文件移动到动态路径。有想法吗?

更新:我能够解决这个问题,但我不会将其称为“答案”,所以我只会更新问题。为了创建较小的集合,我将管道参数化以接受文件名通配符。然后,我创建了另一个管道,它使用 0-9,a-z 数组将其用作数据集的参数。暴力解决方法...假设必须有更好的解决方案,但这目前有效。

最佳答案

阅读文档:Move data to and from Azure Blob storage

以下文章介绍如何使用不同技术将数据移入和移出 Azure Blob 存储。

<小时/>

对于你的情况,我建议你使用SDK,它支持.NET, Java, Node.js, Python, Go, PHP, Ruby.

相信我,如果你想从 AzureBlob 迁移数据,DataFactory 不是一个好方法,它会让问题变得更加复杂。(这是我从 AzureBlob 迁移超过 1 亿个 JSON 文件(超过 2TB)后的建议)

关于azure - 将数百万个文件从根 AZStorageBlob 复制到子文件夹,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59449188/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com