- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在使用以下代码对工作正常的文件执行校验和。但是,当我为一个大文件(比如 2 GB)生成哈希时,速度非常慢。我怎样才能提高这段代码的性能?
fs = new FileStream(txtFile.Text, FileMode.Open);
formatted = string.Empty;
using (SHA1Managed sha1 = new SHA1Managed())
{
byte[] hash = sha1.ComputeHash(fs);
foreach (byte b in hash)
{
formatted += b.ToString("X2");
}
}
fs.Close();
更新:
系统:
操作系统:Win 7 64bit,CPU:I5 750,内存:4GB,硬盘:7200rpm
测试:
测试 1 = 59.895 秒
测试 2 = 59.94 秒
最佳答案
第一个问题是您需要此校验和做什么。如果您不需要加密属性,那么非加密散列或加密安全性较低的散列(MD5 被“破坏”并不能阻止它成为一个好的散列,也不足以用于某些用途)是可能性能更高。您可以通过读取数据的一个子集来创建自己的散列(我建议让这个子集在底层文件的 4096 字节 block 中工作,因为这将匹配 SHA1Managed 使用的缓冲区大小,并且允许比 SHA1Managed 更快的 block 读取如果你确实说每个 X 字节代表 X 的某个值,你就会这么做。
编辑:一个让我想起这个答案的投票,也让我想起了我写过 SpookilySharp它提供了非加密的高性能 32 位、64 位和 128 位哈希,但有利于提供针对错误、存储等的校验和。(这反过来提醒我应该更新它以支持 .NET Core) .
当然,如果您希望文件的 SHA-1 与其他东西进行互操作,那您就被卡住了。
我会尝试不同的缓冲区大小,因为增加文件流缓冲区的大小可以以额外内存为代价提高速度。我会建议 4096 的整数倍(顺便说一下,4096 是默认值),因为 SHA1Managed 一次会请求 4096 个 block ,这样就不会出现 FileStream 返回的少于最多请求(允许但有时次优)或一次复制多个副本。
关于c# - 提高 SHA-1 ComputeHash 的性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3837737/
关闭。这个问题是not reproducible or was caused by typos .它目前不接受答案。 这个问题是由于错别字或无法再重现的问题引起的。虽然类似的问题可能是on-topi
我有 2 个相同的图像,具有不同的图像属性和文件属性(例如 CreationDate 等)。当我计算哈希值时,我得到不同的哈希值。有没有办法跳过这些属性并计算哈希值以获得相同的哈希值? 等待帮助。谢谢
为什么下面两种调用ComputeHash的方法结果长度不同?看起来代码应该产生相同的结果。 byte[] KeyBytes = Convert.FromBase64String("KgMLuq+k1o
我无法得到关于这个问题的明确答案,所以这个问题。过去很少有 SO 帖子提到 HashAlgorithm 的实例在 MSDN 文档中不是线程安全的引用片段。 见 Why does SHA1.Comput
我试图弄清楚如果机器键值不同,已散列的值(使用下面的代码)是否会不同。另外,我想知道其他语言(即 Java)的实现是否会产生不同的结果。 string hashedPassword = Convert
我有一个简单的代码来为文件生成校验和来比较文件是否是新的。 class Program { static void Main(string[] args) { usin
我正在使用 C# 代码: using (var md5 = MD5.Create()) { using (var fStream = File.OpenRead(fFile)) {
我遇到了一个有趣的问题。似乎“HMACSHA256”散列的 ComputeHash() 的行为不是确定性的。如果我使用 HashAlgorithm.Create(“HMACSHA256”) 创建两个
我需要独立计算多个数据 block 的哈希值。像这样: using( HashAlgorithm hasher = new ActualHashAlgorithm() ) { for( int
背景(您可以跳过此部分) 我有大量数据(大约 3 MB)需要在数百台机器上保持最新。一些机器运行 C#,一些运行 Java。数据可能随时更改,需要在几分钟内传播给客户端。数据以 Json 格式从 4
我在问自己,在 asp.net 页面的代码隐藏上使用包含 HMACSHA1 实例的静态(共享)变量是否会很危险。问题在于,在同一个 asp.net 页面上处理多个同时请求时,所有 asp.net 工作
我看不出有什么方法可以对 MD5.ComputeHash(Stream) 加盐。我是否缺少将字节注入(inject) HashAlgorithm 的某种方法? 我尝试在执行流计算之前执行 Comput
我通过以下方式在 C# 中计算字符串的 MD5 哈希值: var provider = new System.Security.Cryptography.MD5CryptoServiceProvide
我发现我维护的一些代码存在问题。下面的代码有一个 private static SHA1 成员(它是一个 IDisposable 但因为它是 static,所以它永远不会被最终确定)。然而,在压力下,
我在使用 computeHash 时遇到了一些麻烦。我同时使用computeHash(Stream) 和computeHash(byte[])。出于某种原因,他们正在回馈不同的结果。我试过将 byte
我通过下面的代码定期计算文件的 MD5 哈希值。这些文件大约有 10MB。当我在 Debug模式(调试 | x64)下运行我的程序时,对 ComputeHash() 的调用需要 35 毫秒,如果在 R
我正在使用以下代码对工作正常的文件执行校验和。但是,当我为一个大文件(比如 2 GB)生成哈希时,速度非常慢。我怎样才能提高这段代码的性能? fs = new FileStream(txtFile.T
我收到 ObjectDisposedException:安全句柄已关闭。 这是我的代码: 我正在尝试创建一个接口(interface)和实现类,这将使我能够获取一个字符串,将一个已知 key 附加到它
有人可以向我解释为什么不使用 T-SQL SELECT substring(master.dbo.fn_varbintohexstr(hashbytes('MD5', 'HelloWorld')),
我正在寻找计算大文件 (3GB) 哈希值的有效方法,并意识到使用参数 -hashfile 调用 Windows certutil 执行哈希计算比通过 执行哈希计算快 4 倍(16 秒) code>SH
我是一名优秀的程序员,十分优秀!