gpt4 book ai didi

database-design - 使用 SHA-256 哈希作为主键时,可以忽略冲突的可能性吗?

转载 作者:行者123 更新时间:2023-12-05 06:45:25 25 4
gpt4 key购买 nike

<分区>

我有这种情况,我的硬盘上有文件,我想将有关它们的信息缓存在数据库中。考虑到其中一些文件可能会达到 GB,否则需要很长时间才能解析的信息。

我的第一直觉是将文件路径用作文件的唯一标识符,并将其用作键 (TEXT/VARCHAR) 并将信息作为值存储在数据库表中。

鉴于在某些文件系统下(尤其是在 *nix 中),文件路径可以是无限长的。使用文件名作为数据库中的主键似乎是个坏主意。仅在字符串字段上建立索引会慢得多,更不用说内存/空间限制了。

我想,也许,我从完整的文件路径 (/usr/xxx/1/2/../abc.xyz) 生成 SHA-256 哈希,并将其用作我的数据库中的主键(固定宽度)。另一个想法是从文件内容生成 SHA-256 哈希。然而,这也可能变得相当耗时。

我的问题是 - 在这种情况下,哈希冲突的可能性是否与此优秀 thread 上提供的答案一样小? .

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com