gpt4 book ai didi

azure - 如何对以句点结尾的 blob 名称进行编码?

转载 作者:IT王子 更新时间:2023-10-29 02:37:14 25 4
gpt4 key购买 nike

Azure docs :

Avoid blob names that end with a dot (.), a forward slash (/), or a sequence or combination of the two.

由于旧版 s3 兼容性,我无法避免使用此类名称,因此我必须对它们进行编码。

我应该如何对这些名称进行编码?

我不想使用 base64,因为这会使在 azure 的 blob 控制台中查找时很难进行调试。

Go 有 https://golang.org/pkg/net/url/#QueryEscape但它有this limitation :

From Go's implementation of url.QueryEscape (specifically, the shouldEscape private function), escapes all characters except the following: alphabetic, decimal digits, '-', '_', '.', '~'.

最佳答案

我认为没有任何通用的解决方案可以在您的应用程序范围之外处理此问题。在您的应用程序范围内,您可以进行任何编码,因此您希望如何布置数据取决于个人喜好。没有“正确”的方法来做到这一点。

无论如何,我相信您应该选择以下属性:

  • 转换必须是双向的,并且与预期的文件 namespace 不存在冲突
  • 请保持文件名不带结尾点未编码
  • 对于以点结尾的文件,请仅对冲突的点进行编码,保持原始名称可读。

这将使大多数(不冲突的)文件保持简短,并具有原始直观或希望有意义的名称,并且如果您能够重命名或逐步淘汰冲突文件,只需删除转换逻辑,而无需重组所有存储的数据及其网址。

我为此建议两个例子。我们建议您有文件:

/someParent/normal.txt
/someParent/extensionless
/someParent/single.
/someParent/double..

使用特殊子容器

您可以从文件名末尾删除 N 个点,并将它们转换为子容器名称“dot”、“dotdot”等。

结果网址如下:

/someParent/normal.txt
/someParent/extensionless
/someParent/dot/single
/someParent/dotdot/double

阅读时,您可以删除“点”*N 文件夹级别并将 N 个点添加回文件名。显然,这假设您不需要将此类“点”文件夹作为数据本身。

如果存储的文件可以带有任何扩展名,但您可以对文件夹结构做出一些假设,则这是首选。

使用可丢弃的人工扩展

由于冲突在最后,您可以将从未使用过的虚拟扩展名附加到给定文件。例如“endswithdots”,但您可以根据预期的扩展名选择更合适的内容:

/someParent/normal.txt
/someParent/extensionless
/someParent/single.endswithdots
/someParent/double..endswithdots

读取文件扩展名时,如果文件扩展名是“endswithdots”,则从文件名末尾删除“endswithdots”部分。

如果您的数据可以具有任何容器结构,但您可以对传入扩展做出一些假设,则这是首选。

<小时/>

我建议不要使用 Base64 或其他全名编码,因为它会使文件名明显更长,并丢失文件名可能包含的任何有意义的细节。

关于azure - 如何对以句点结尾的 blob 名称进行编码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51529904/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com