gpt4 book ai didi

C#文件管理

转载 作者:可可西里 更新时间:2023-11-01 03:06:43 26 4
gpt4 key购买 nike

如何在 C# 中检测两个文件是否完全相同(大小、内容等)?

最佳答案

这是一个简单的解决方案,它只读取两个文件并比较数据。它应该不会比散列方法慢,因为这两种方法都必须读取整个文件。 编辑 正如其他人所指出的,这种实现实际上比散列方法慢一些,因为它很简单。请参阅下面的更快方法。

static bool FilesAreEqual( string f1, string f2 )
{
// get file length and make sure lengths are identical
long length = new FileInfo( f1 ).Length;
if( length != new FileInfo( f2 ).Length )
return false;

// open both for reading
using( FileStream stream1 = File.OpenRead( f1 ) )
using( FileStream stream2 = File.OpenRead( f2 ) )
{
// compare content for equality
int b1, b2;
while( length-- > 0 )
{
b1 = stream1.ReadByte();
b2 = stream2.ReadByte();
if( b1 != b2 )
return false;
}
}

return true;
}

您可以将其修改为一次读取多个字节,但内部文件流应该已经在缓冲数据,因此即使是这个简单的代码也应该相对较快。

编辑 感谢您对此处速度的反馈。我仍然认为比较所有字节的方法可以和 MD5 方法一样快,因为这两种方法都必须读取整个文件。我怀疑(但不确定)一旦文件被读取,比较所有字节的方法需要较少的实际计算。无论如何,我为我的初始实现复制了您的性能观察结果,但是当我添加一些简单的缓冲时,比较所有字节的方法同样快。下面是缓冲实现,欢迎进一步评论!

编辑 Jon B 提出了另一个很好的观点:在文件实际不同的情况下,该方法可以在找到第一个不同的字节后立即停止,而哈希方法必须读取在每种情况下都包含两个文件的全部内容。

static bool FilesAreEqualFaster( string f1, string f2 )
{
// get file length and make sure lengths are identical
long length = new FileInfo( f1 ).Length;
if( length != new FileInfo( f2 ).Length )
return false;

byte[] buf1 = new byte[4096];
byte[] buf2 = new byte[4096];

// open both for reading
using( FileStream stream1 = File.OpenRead( f1 ) )
using( FileStream stream2 = File.OpenRead( f2 ) )
{
// compare content for equality
int b1, b2;
while( length > 0 )
{
// figure out how much to read
int toRead = buf1.Length;
if( toRead > length )
toRead = (int)length;
length -= toRead;

// read a chunk from each and compare
b1 = stream1.Read( buf1, 0, toRead );
b2 = stream2.Read( buf2, 0, toRead );
for( int i = 0; i < toRead; ++i )
if( buf1[i] != buf2[i] )
return false;
}
}

return true;
}

关于C#文件管理,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/211008/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com