gpt4 book ai didi

azure - 拥有许多小型 Azure 存储 Blob 容器(每个容器都包含一些 Blob)更好,还是拥有一个包含大量 Blob 的大型容器更好?

转载 作者:行者123 更新时间:2023-12-03 05:19:26 29 4
gpt4 key购买 nike

所以场景如下:

我有多个 Web 服务实例,用于将 blob 数据写入 Azure 存储。我需要能够根据收到的时间将 blob 分组到容器(或虚拟目录)中。偶尔(最坏的情况是每天)旧的 blob 会被处理然后删除。

我有两个选择:

选项 1

我制作了一个名为“blob”的容器(例如),然后将所有博客存储到该容器中。每个 blob 将使用目录样式名称,目录名称为接收时间(例如“hr0min0/data.bin”、“hr0min0/data2.bin”、“hr0min30/data3.bin”、“hr1min45/data.bin” "、...、"hr23min0/dataN.bin"等 - 每 X 分钟一个新目录)。处理这些 blob 的事物将首先处理 hr0min0 blob,然后是 hr0minX,依此类推(处理时 blob 仍在写入)。

选项 2

我有许多容器,每个容器都有一个基于到达时间的名称(因此首先是一个名为 blobs_hr0min0 的容器,然后是 blobs_hr0minX 等),容器中的所有 blob 都是在指定时间到达的 blob。处理这些博客的东西将一次处理一个容器。

所以我的问题是,哪个选项更好?选项 2 是否可以提供更好的并行化(因为容器可以位于不同的服务器中),或者选项 1 是否更好,因为许多容器可能会导致其他未知问题?

最佳答案

每个人都为您提供了有关直接访问 blob 的出色答案。但是,如果您需要列出容器中的 blob,您可能会发现多容器模型具有更好的性能。我刚刚与一家公司交谈过,该公司一直在单个容器中存储大量 blob。他们经常列出容器中的对象,然后针对这些 blob 的子集执行操作。他们发现性能受到了影响,因为检索完整列表的时间一直在增长。

这可能不适用于您的场景,但值得考虑......

关于azure - 拥有许多小型 Azure 存储 Blob 容器(每个容器都包含一些 Blob)更好,还是拥有一个包含大量 Blob 的大型容器更好?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8158452/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com