gpt4 book ai didi

database - 我应该将上传的文件名存储在数据库中吗?

转载 作者:行者123 更新时间:2023-12-04 13:15:09 24 4
gpt4 key购买 nike

我有一个以自动增量 ID 作为主键的数据库表。

对于这个表的每条记录,我最多可以有 3 个文件,这些文件可以公开获取,因此随机文件名生成不是强制性的,这些文件是可选的。

我想我有 2 种可能的解决方案:

  • 将随机生成的文件名存储在 3 个可为空的 varchar 列中,并将所有文件存储在同一位置:

    • 列:一个 |乙 | c
    • 上传/f6se54fse654.jpg
  • 不存储文件名,而是将它们放在特定的文件夹中,并将它们命名为与主键值相同的名称:

    • 上传/a/1.jpg
    • 上传/b/1.jpg
    • 上传/c/1.jpg

通过最后一个解决方案,我知道 uploads/a/1.jpg 属于 ID 1 的记录,并且是 a< 类型的文件。但我必须检查文件是否存在,因为文件是可选的。

您认为这一切有什么好的做法吗?或者也许有更好的方法?

最佳答案

如果您正在谈论的文件旨在供用户显示或下载(无论是访问者还是经过身份验证的用户,是否按角色(ACL)过滤),确保(恕我直言)用户将除了已发送给他的有关资源的内容之外,无法猜测其他信息。没有完美的解决方案可以无一异常(exception)地适用于所有情况,所以让我们举个例子来给你更多的解释。

为了增强敏感数据的安全性和完全不透明性,例如对于 uploads/users/7/invoices/3.pdf 的特定情况,我认为确保绝对没有人能猜出可能与用户或任何其他实体相关联的文件数量(否则,在本例中,我们可以想象可能存在其他可访问文件 - 1.pdf 和 2.pdf)。通过设计,我们通常希望在明确定义的特定情况和上下文中授予对文件的访问权限。但是,对于旨在供所有人查看的图像文件(例如个人资料照片),情况可能并非如此。这就是为什么上下文在某种程度上很重要。

如果您选择保留自动递增的标识符作为名称来引用您的文件,这也可以提供有关存储在数据库中的数据大小的信息 (/uploads/invoices/128.pdf 通知您的服务器上可能已经有 127 张发票)并且可能会激励不道德的人尝试获取不应从定义的上下文中获取的资源。如果您选择使用某种唯一生成的标识符 (GUID),这种情况可能不太明显。

我建议您阅读 this article关于为每个上传或创建的文件生成 (G)/(U)UID(128 位十六进制数)存储在您的数据库中。如果您使用最新版本的 MySQL,甚至可以将此标识符托管在提供自动转换为 UUID 的 binary (16) 类型中,我让您阅读 this interesting topic与我所指的有关。它可能会将此输出为 /uploads/invoices/b0016303-8e4f-487a-8c30-5dddf1ebf7e9.pdf,只要您确保生成的标识符是唯一哈希值,这样会好很多。

在这里谈论性能问题对我来说似乎没有用,因为今天有很多缓存文件或路径和url的方法,这避免了在很多调用资源的情况下(通常是按他们在大数据案例中的受欢迎程度排序)。

最后但并非最不重要的是,许多网络和移动平台应用程序(我想到了 Slack、Discord、Facebook、Twitter...),它们每天存储大量媒体文件,这些文件通常与帐户用户相关联,包括公共(public)和 secret 文件和信息,为每个文件和信息生成一个唯一的哈希值。

Twitter 使用自己的唯一标识符字符串(64 位 BIGINT)生成器,称为 Twitter Snowflake您可能也有兴趣阅读。它基于 UNIX 纪元值,根据定义,该值在每个毫秒节拍都是唯一的。

没有一个可以适用于所有情况的全局和完美的解决方案,但我希望这对您有所帮助,因为您可能希望对此进行更深入的研究,并为您所处的每个上下文和实体找到“最佳解决方案” '将存储和链接文件。

关于database - 我应该将上传的文件名存储在数据库中吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61267628/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com