gpt4 book ai didi

c# - 为什么 FileStream 和字符串的 MD5 哈希不同 C#

转载 作者:行者123 更新时间:2023-11-30 15:01:58 25 4
gpt4 key购买 nike

我使用 System.Security.Cryptography.MD5 从字符串和包含相同字符串的文件生成 MD5 哈希。但是哈希值不同。

这是从字符串生成的代码

byte[] data = Encoding.ASCII.GetBytes("The quick brown fox jumps over the lazy dog");
byte[] hash = MD5.Create().ComputeHash(data);
return BitConverter.ToString(hash).Replace("-", "").ToLower();

这是我从文件生成散列时的代码

internal static string CalculateFileHashTotal(string fileLocation) 
{
using(var md5 = MD5.Create())
{
using (var stream = File.OpenRead(fileLocation))
{
byte[] b = md5.ComputeHash(stream);
stream.Close();
return BitConverter.ToString(b).Replace("-", "").ToLower();
}
}
}

字符串中的 Hash 是正确的,所以我假设文件中的 Hash 读取了一些额外的东西或者没有读取整个文件。我在谷歌上找不到答案。

有什么想法吗?

最佳答案

哈希值不同,因为数据不同。

该文件是 UTF-8,而不是 ASCII,因此您应该使用 UTF-8 编码将字符串转换为字节以获得相同的结果:

byte[] data = Encoding.UTF8.GetBytes("The quick brown fox jumps over the lazy dog");

此外,该文件可能包含 BOM (byte order mark)一开始。这包含在数据中,因为文件不是作为文本读取的。

在数据的开头添加 UTF-8 BOM 会得到相同的哈希值:

byte[] bom = { 239, 187, 191 };
byte[] data = Encoding.UTF8.GetBytes("The quick brown fox jumps over the lazy dog");

byte[] bomdata = new byte[bom.Length + data.Length];
bom.CopyTo(bomdata, 0);
data.CopyTo(bomdata, bom.Length);
byte[] hash = MD5.Create().ComputeHash(bomdata);

关于c# - 为什么 FileStream 和字符串的 MD5 哈希不同 C#,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13245842/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com