gpt4 book ai didi

azure - 在Azure Blob存储中为大量数据设置Blob索引标记的最佳方法是什么

转载 作者:行者123 更新时间:2023-12-02 06:37:50 41 4
gpt4 key购买 nike

我需要向 Azure Blob 存储(近 40TB)中现有的大量数据添加 Blob 索引标记。对于将来要上传的所有 Blob 也应该执行相同的操作。对于后者,我需要创建一个定期执行的 powershell 脚本,该脚本应该只获取上次修改日期大于给定日期时间的 blob,并添加一个值等于上次修改日期的索引标记。这可能吗 ?如果是,如何? 。另外,向大量数据添加索引并对性能影响最小的理想方法是什么?
注意:我是 azure 的新手。更好的想法值得赞赏。

我的目标是定期(例如每周)备份 blob。目前,由于 blob 大小较大,迭代所有这些数据需要 1 天以上的时间。我希望减少利用索引标签的时间,并且为了实现这一目标,我不想在 blob 上传期间设置索引标签。(这是一种“不要碰”遗留代码)。总而言之,我需要一种机制来快速找到上周添加的 blob(无需迭代所有 blob),使用 blob 的上次修改日期和将来的某个时间设置索引标签,我将通过过滤这些索引标签来进行备份.

最佳答案

您能否通过将“上次修改时间”添加为索引标记来澄清您想要实现什么目的?您打算如何使用此标签?

此存储帐户中有多少个 blob?

Blob 索引标签可以使用 Set Blob Tags API 设置,或等效的 PS/CLI,例如 Set-AzStorageBlobTag .

对于现有的 blob,您需要调用 Get Blob Properties提取上次修改时间,然后将其设置为标签。

对于上传到存储帐户的新 Blob,您是否可以控制上传 Blob 的客户端?如果是这样,如果客户端在上传 blob 时将当前时间设置为标签,效率会更高。您可以使用 ABAC 强制客户端在上传过程中包含具有特定 key 的标签 – 请参阅 Example Azure role assignment conditions (preview) - Azure RBAC - Azure Storage | Microsoft Docs.

关于azure - 在Azure Blob存储中为大量数据设置Blob索引标记的最佳方法是什么,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/70097392/

41 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com