hash - 不同文件大小的哈希冲突与相同文件大小的哈希冲突的可能性相同吗？-6ren

hash - 不同文件大小的哈希冲突与相同文件大小的哈希冲突的可能性相同吗？

转载作者：行者123 更新时间：2023-12-02 17:59:09

25

4

我正在对大量文件进行哈希处理，为了避免哈希冲突，我还存储了文件的原始大小 - 这样，即使存在哈希冲突，文件大小也不太可能相同。这是听起来的声音吗(哈希冲突同样可能是任何大小)，还是我需要另一条信息(如果冲突更有可能与原始长度相同)。

或者，更一般地说:无论原始文件大小如何，每个文件都可能产生特定的哈希值吗？

最佳答案

哈希函数通常被编写为将数据均匀分布在所有结果存储桶中。

如果您假设您的文件均匀分布在固定的可用大小范围内，则可以说您的文件只有 1024 (2^10) 个均匀分布的不同大小。存储文件大小最多只能通过不同文件大小的数量来减少冲突的可能性。

注意:我们可以假设它是 2^32 均匀分布且大小不同，但它仍然不会改变其余的数学计算。

人们普遍认为 MD5 上发生冲突的一般概率(例如)是 1/(2^128) .

除非有专门内置到哈希函数中的东西另有说明。给定任何有效的 X使得 P(MD5(X) == MD5(X+1)) 的概率与任何两个随机值保持相同{Y , Z也就是说 P(MD5(Y) == MD5(Z)) =P(MD5(X) == MD5(X+1)) =1/(2^128)对于 X 的任何值, Y和Z .

将此与 2^10 个不同文件相结合意味着通过存储文件大小，您最多可以获得额外的 10 位来表示项目是否不同(同样假设您的文件对于所有值均匀分布) .

因此，您所做的最好的事情就是为 <=N 字节的唯一值添加另外 N 字节的存储空间(它永远不会 >N)。因此，您最好使用 SHA-1/2 等内容来增加哈希函数返回的字节数，因为与存储文件大小相比，这更有可能为您提供均匀分布的哈希值数据。

简而言之，如果 MD5 不足以应对冲突，请使用更强的哈希值，如果更强的哈希值太慢，则使用冲突几率较低的快速哈希值，例如 MD5，并且然后使用较慢哈希(例如 SHA-1 或 SHA256)来减少冲突的机会，但如果 SHA256 足够快并且双倍空间不是问题，那么您可能应该使用 SHA256。

关于hash - 不同文件大小的哈希冲突与相同文件大小的哈希冲突的可能性相同吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/2442632/

25

4

0

文章推荐： extjs - 如何用ExtJS销毁一个对象的所有实例？

文章推荐： sql - 如何在 BigQuery 中选择包含所有 NULL 值的数据列

文章推荐： playn - 如何设置 PlayN 大小

文章推荐： Highcharts x Axis 自定义缩放

hash - 我如何使用 std::hash::hash？
我正在尝试使用 Rust 的 std::hash 函数: use std::hash::{hash, Hash, SipHasher}; #[test] fn hash_test() { pr
ruby : Generate a Hash of Hashes from an Array of Hashes
我有以下内容 friends = [{ name: "Jack", attr1:"def", attr2:"def" }, { name: "Jill", attr1:"def", attr2:"de
ruby - 参数错误 : comparison of Hash with Hash failed - Sorting an array of hashes by hash name
我有以下数组: names = [ {"Adriana"=>{:gender=>"female", :nationality=>"danish"}}, {"Adriane"=>{:gender=>"f
Perl hash of hashes of hashes ... 是否有 'easy' 方法来获取列表末尾的元素？
我有一个哈希的 Perl 哈希......大约 11 或 12 个元素深。请原谅我没有重复下面的结构! 一些级别有固定的标签，例如'NAMES' , 'AGES'或类似的，因此访问这些级别很好，因为我
hash - 基于物理身份的替代Hashtbl.hash
我试图派生一个描述结构化值的Graphviz文件。这是出于诊断目的，因此我希望我的图形尽可能接近地反射(reflect)内存中的实际结构。我正在使用下面的方法将值映射到Graphviz顶点，以便当一个
ruby - 在 Ruby 中访问 Hash of Hash of Hash
我正在尝试获取在 xlm 中传递的事件日志条目，将它们转换为散列，然后存储到数据库中。我目前正在使用 XmlSimple gem 将 xml 输入转换为散列。测试样本输入: require 'xm
ruby - `Hash#reject!` 和 `Hash#reject` 与 `Hash#delete_if` 有何不同？
对于 Ruby 中的 Hash，reject! 和 reject 与 delete_if 有何不同？谁能用简单的代码片段解释它们之间的区别？最佳答案由于其他答案指的是 Array#delete_i
Perl Hash of Hashes 和计数
我正在尝试处理我使用 Data::Dumper 输出的 perl 数据结构 $VAR1 = 'GAHD'; $VAR2 = [ { 'COUNTRY' => 'US',
hash - DPDK Hash 无法从辅助进程中查找数据
无法使用来自辅助进程的现有 rte Hash: h = rte_hash_find_existing("some_hash"); if (h) { // this will w
Perl Hash of Hashes，获取最低数字键
我有一个散列的散列，其中第一个键是一个字符串，第二个键是一个整数。我试图在散列的散列中获得最低的第二个键。这是我的哈希。 %HoH = ( flintstones => { 8
perl - 数据库记录到 Hash-of-hashes
如何从一系列数组中生成哈希中的哈希？我需要从这里开始: my @data = /one two three/; my $value = 13: 为此: $hoh = { 'one' => { 'two
perl hash hash 中奇数个元素
我有这个配置文件 dbUser=customer dbPass=passwrd dbSid=customer.shadow passwdFile=/production/etc-user tmpUse
hash - 如何对使用rust 的单元结构执行 `Hash`？
我想实现一种thing，可以唯一标识，除此之外，它不包含其他字段。它有点像 ruby 中的 BasicObject 或 java 中的 Object。我添加了一个 PartialEq 特征。 s
ruby - Hash in Hash 给出错误的值作为返回？
我正在尝试使用以下键存储二维哈希: 维度 1 = 数字但不连续维度 2 = 字符串(如 :id 和 :value) 当元素未初始化时会出现问题。 memory = Hash.new(Hash.new
ruby - : "Hash.new takes a default value for the hash, which is the value of the hash for a nonexistent key"是什么意思
我目前正在学习 Michael Hartl 的 Ruby on Rails 教程不理解在 section 4.4.1 中找到的此语句的含义: Hashes, in contrast, are dif
ruby - 如何修改 Hash 以允许在 Ruby 中通过更短的 'hash[:a][:b]' 访问元素 'hash[:a,:b]'？
我很乐意通过更短的表达式访问多维哈希数组的任何元素 h = {a: {b: 'c'}} # default way p h[:a][:b] # => "c" # a nicer way p h[:a,
hash - 无法加载内核二进制文件 :Invalid SDK hash
我想在编写 flutter channel beta 后运行 flutter web 它回复:Can't load kernel binary:Invalid SDK hash，你知道如何解决这个问题
hash - DynamoDB : How is the hash key used?
我最近正在研究 Amazon 提供的新 NoSQL 服务，更具体地说是 DynamoDB。亚马逊说你应该避免使用不均匀分布的键作为主键，即主键应该越独特越好。我可以认为这是最好的情况下每个项目都有唯
hash - 如何在 Redis Hash 上执行搜索？
我的游戏中有很多哈希值，例如 HMSET('hash1', 'level', 25, 'connected', 2) HMSET('hash2', 'level', 50, 'connected',
hash - "over"中的 "overpass-the-hash"是什么意思？
我必须翻译这句话:'Susspected overpass-the-hash attack (Kerberos)' 我发现了这篇关于立交桥哈希的文章:https://blog.stealthbits.

首页

博学

6Ren·AI

商城

hash - 不同文件大小的哈希冲突与相同文件大小的哈希冲突的可能性相同吗？