c# - GZipStream - 即使刷新也不写入所有压缩数据？-6ren

c# - GZipStream - 即使刷新也不写入所有压缩数据？

转载作者：太空狗更新时间：2023-10-29 22:13:46

27

4

我遇到了一个针对 .Net 3.5 的 gzipstream 的讨厌问题。这是我第一次使用 gzipstream，但是我已经模仿了许多教程，包括 here我仍然卡住了。

我的应用程序将数据表序列化为 xml 并插入数据库，将压缩数据存储到 varbinary(max) 字段以及未压缩缓冲区的原始长度。然后，当我需要它时，我检索这些数据并将其解压缩并重新创建数据表。解压缩似乎失败了。

编辑:遗憾的是，按照建议将 GetBuffer 更改为 ToArray 后，我的问题仍然存在。代码更新如下

压缩代码:

DataTable dt = new DataTable("MyUnit");
//do stuff with dt
//okay...  now compress the table
using (MemoryStream xmlstream = new MemoryStream())
{
    //instead of stream, use xmlwriter?
    System.Xml.XmlWriterSettings settings = new System.Xml.XmlWriterSettings();
    settings.Encoding = Encoding.GetEncoding(1252);
    settings.Indent = false;
    System.Xml.XmlWriter writer = System.Xml.XmlWriter.Create(xmlstream, settings);
    try
    {
        dt.WriteXml(writer);
        writer.Flush();
    }
    catch (ArgumentException)
    {
        //likely an encoding issue...  okay, base64 encode it
        var base64 = Convert.ToBase64String(xmlstream.ToArray());
        xmlstream.Write(Encoding.GetEncoding(1252).GetBytes(base64), 0, Encoding.GetEncoding(1252).GetBytes(base64).Length);
    }

    using (MemoryStream zipstream = new MemoryStream())
    {
        GZipStream zip = new GZipStream(zipstream, CompressionMode.Compress);
        log.DebugFormat("Compressing commands...");
        zip.Write(xmlstream.GetBuffer(), 0, xmlstream.ToArray().Length);
        zip.Flush();
        float ratio = (float)zipstream.ToArray().Length / (float)xmlstream.ToArray().Length;
        log.InfoFormat("Resulting compressed size is {0:P2} of original", ratio);

        using (SqlCommand cmd = new SqlCommand())
        {
            cmd.CommandText = "INSERT INTO tinydup (lastid, command, compressedlength) VALUES (@lastid,@compressed,@length)";
            cmd.Connection = db;
            cmd.Parameters.Add("@lastid", SqlDbType.Int).Value = lastid;
            cmd.Parameters.Add("@compressed", SqlDbType.VarBinary).Value = zipstream.ToArray();
            cmd.Parameters.Add("@length", SqlDbType.Int).Value = xmlstream.ToArray().Length;
            cmd.ExecuteNonQuery();

        }
    }

解压代码:

/* This is an encapsulation of what I get from the database
 public class DupUnit{
    public uint lastid;
    public uint complength;
    public byte[] compressed;
}*/
  //I have already retrieved my list of work to do from the database in a List<Dupunit> dupunits
foreach (DupUnit unit in dupunits)
{
    DataSet ds = new DataSet();
    //DataTable dt = new DataTable();
    //uncompress and extract to original datatable
    try
    {
        using (MemoryStream zipstream = new MemoryStream(unit.compressed))
        {
            GZipStream zip = new GZipStream(zipstream, CompressionMode.Decompress);
            byte[] xmlbits = new byte[unit.complength];
            //WHY ARE YOU ALWAYS 0!!!!!!!!
            int bytesdecompressed = zip.Read(xmlbits, 0, unit.compressed.Length);
            MemoryStream xmlstream = new MemoryStream(xmlbits);
            log.DebugFormat("Uncompressed XML against {0} is: {1}", m_source.DSN, Encoding.GetEncoding(1252).GetString(xmlstream.ToArray()));
            try{
               ds.ReadXml(xmlstream);
            }catch(Exception)
            {
                //it may have been base64 encoded...  decode first.
               ds.ReadXml(Encoding.GetEncoding(1254).GetString(
                 Convert.FromBase64String(
                 Encoding.GetEncoding(1254).GetString(xmlstream.ToArray())))
                 );
            }
            xmlstream.Dispose();
        }
    }
    catch (Exception e)
    {
        log.Error(e);
        Thread.Sleep(1000);//sleep a sec!
        continue;
    }

注意上面的评论...bytesdecompressed 始终为 0。有什么想法吗？我做错了吗？

编辑 2:

所以这很奇怪。我在解压例程中添加了以下调试代码:

   GZipStream zip = new GZipStream(zipstream, CompressionMode.Decompress);
   byte[] xmlbits = new byte[unit.complength];
   int offset = 0;
   while (zip.CanRead && offset < xmlbits.Length)
   {
       while (zip.Read(xmlbits, offset, 1) == 0) ;
       offset++;
   }

调试时，有时该循环会完成，但有时会挂起。当我停止调试时，它将位于 1616 字节中的第 1600 字节。我会继续，但它根本不会移动。

编辑 3: 该错误似乎出现在压缩代码中。无论出于何种原因，它都没有保存所有数据。当我尝试使用第三方 gzip 机制解压缩数据时，我只得到了部分原始数据。

我会开始赏金，但我现在真的没有多少声望可以给予 :-(

最佳答案

终于找到答案了。压缩数据不完整，因为 GZipStream.Flush() 完全没有做任何事情来确保所有数据都在缓冲区之外 - 您需要使用 GZipStream.Close() 作为 pointed out here .当然，如果压缩不好，一切都会变得糟糕 - 如果您尝试解压缩它，Read() 将始终返回 0。

关于c# - GZipStream - 即使刷新也不写入所有压缩数据？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24512675/

27

4

0

文章推荐： c# - 使用 EWS 检索约会时，主题包含组织者姓名

文章推荐： python - 从 IronPython 使用 NumPy 和 SciPy 的 final方法

文章推荐： python - 在 Sublime Text 2 插件中访问快速面板

文章推荐： c# - 如何注销 session MVC Razor visual studio

gzipstream - 如何使用 GZipStream 压缩或压缩整个文件夹
知道我该怎么做吗？我能够压缩单个文件。最佳答案您不能直接 GZip 整个文件夹，因为 GZip 对单个数据流进行操作。您首先必须将文件夹转换为这样的流。一种方法是创建一个 Tar archive
.NET GZipStream 压缩和解压
下面这段代码有什么问题。我总是得到 FALSE，意思是压缩后，解压后的数据与原始值不匹配。 public static bool Test() { string
c# - GZipStream:压缩文件比原始文件大
我正在尝试在 C# 中使用 gzip 流，但压缩后的文件似乎比以前大。当我处理 .avi 和 .mkv 文件时会发生这种情况。但是，如果我使用比原始文件小的 .txt 和 .html 压缩文件。 us
c# - gzipstream 内存流到文件
我正在尝试使用 Gzip 压缩来压缩 JSON 文件以发送到另一个位置。它每天需要处理 5,000 - 10,000 个文件，我不需要本地机器上文件的压缩版本(它们实际上正在传输到 AWS S3 以进
c# - GZipStream 只解压第一行
我的 GZipStream 只会解压缩文件的第一行。通过 7-zip 提取内容按预期工作并为我提供了整个文件内容。它还在 cygwin 和 linux 上使用 gunzip 按预期提取，所以我希望这是
c# - GZipStream zip文件无效或损坏
打开zip文件时出现问题。我正在使用以下代码来压缩文件： public static string Zip_File(string soruce , string target) { try
c# - gzipstream 用于套接字上的仅转发流
我正在 Windows Phone 7 上开发一个应用程序。我需要压缩/解压缩我的数据以便通过 tcp 套接字发送它。但我一直没能找到任何 gzip 压缩器用于通过 tcp 套接字的仅转发流。请帮
c# - GZipStream 和解压
我有应该进行压缩的代码: FileStream fs = new FileStream("g:\\gj.txt", FileMode.Open); FileStream fd = new FileSt
c# - GZipStream 机器依赖
我在 .NET 4.0 中遇到了一些奇怪的依赖于机器/操作系统的 GZipStream 行为。这是相关代码: public static string Compress(string input) {
c# - 大数据上的 GZipStream
我正在尝试压缩大量数据，有时在 100GB 左右，当我运行我编写的例程时，它看起来文件大小与以前的大小完全相同。还有其他人遇到过 GZipStream 的这个问题吗？我的代码如下:
c# - GZipStream - 即使刷新也不写入所有压缩数据？
我遇到了一个针对 .Net 3.5 的 gzipstream 的讨厌问题。这是我第一次使用 gzipstream，但是我已经模仿了许多教程，包括 here我仍然卡住了。我的应用程序将数据表序列化为
c# - GZipStream 压缩不起作用
我正在尝试读取文件并使用 GZipStream 压缩它，如下所示: using (var outStream = new MemoryStream()) { using (var fileSt
C# GZipStream 到字符串
我需要一种将 GZipStream 写入字符串的方法。我正在使用: GZipStream Decompress = new GZipStream(inFile, CompressionMode.De
c# - GZipStream 有效性
我正在尝试将大型 UInt16 数组保存到文件中。 positionCnt大约是50000，stationCnt大约是2500。直接保存，没有GZipStream，文件大约250MB，可以通过外部zi
c# - GZipStream 没有读取整个文件
我有一些代码可以下载 gzip 文件并解压缩它们。问题是，我无法让它解压缩整个文件，它只读取前 4096 个字节，然后再读取大约 500 个字节。 Byte[] buffer = new Byte[4
c# - GZipStream 有效但扩展名丢失
我正在使用以下代码来压缩文件并且它工作正常但是当我使用 WinRar 解压缩时我得到没有扩展名的原始文件名，任何线索为什么如果文件名是 myReport.xls 当我解压缩我只得到 myReport
.net - 什么会导致 GZipStream 压缩数据过多地填充零？
我正在使用 .NET 框架中的 GZipStream 类压缩一些数据包。一切正常，压缩率也不错，但是当我使用十六进制编辑器查看压缩数据时，我注意到每个压缩数据包中有多达三分之一是尾随零。这正常吗？大
.net - 什么会导致 GZipStream 压缩数据过多地填充零？
我正在使用 .NET 框架中的 GZipStream 类压缩一些数据包。一切正常，压缩率也不错，但是当我使用十六进制编辑器查看压缩数据时，我注意到每个压缩数据包中有多达三分之一是尾随零。这正常吗？大
c# - JsonSerializer 无法写入 GZipStream
我正在尝试将非常大的对象直接序列化为 zip 流。我设法通过在中间步骤中序列化到文件流、将其加载回来然后压缩它来做到这一点。我还尝试过直接压缩到内存流并且它有效。但是当我使用 GZipStream
c# - 我可以在不写入中间临时存储的情况下获取文件的 GZipStream 吗？
我可以获取磁盘上文件的 GZipStream 而不将整个压缩内容写入临时存储吗？我目前正在磁盘上使用临时文件，以避免在非常大的文件上使用 MemoryStream 可能出现的内存耗尽(这工作正常)。

首页

博学

6Ren·AI

商城

c# - GZipStream - 即使刷新也不写入所有压缩数据？