gpt4 book ai didi

filesystems - 如何查找所有内容相同的文件?

转载 作者:行者123 更新时间:2023-12-01 07:31:03 28 4
gpt4 key购买 nike

这是一个 interview question :“给定一个包含大量文件的目录,找到具有相同内容的文件”。我建议使用散列函数来生成文件内容的散列值,并仅比较具有相同散列值的文件。是否有意义 ?

接下来的问题是如何选择哈希函数。您会为此目的使用 SHA-1 吗?

最佳答案

我宁愿使用哈希作为第二步。在一般情况下,首先按文件大小对目录进行排序,然后仅在存在重复大小时才进行散列和比较,这可能会大大改善您的搜索范围。

关于filesystems - 如何查找所有内容相同的文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4123818/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com