java - ZLib 解压缩在大字节数组上失败-6ren

java - ZLib 解压缩在大字节数组上失败

转载作者：塔克拉玛干更新时间：2023-11-03 03:46:13

25

4

在尝试使用 ZLib 压缩时，我遇到了一个奇怪的问题。如果源数组的长度至少为 32752 字节，则使用随机数据解压缩 zlib 压缩的字节数组会重复失败。这是一个重现问题的小程序，您可以 see it in action on IDEOne .压缩和解压方法是从教程中摘取的标准代码。

public class ZlibMain {

    private static byte[] compress(final byte[] data) {
        final Deflater deflater = new Deflater();
        deflater.setInput(data);

        deflater.finish();
        final byte[] bytesCompressed = new byte[Short.MAX_VALUE];
        final int numberOfBytesAfterCompression = deflater.deflate(bytesCompressed);
        final byte[] returnValues = new byte[numberOfBytesAfterCompression];
        System.arraycopy(bytesCompressed, 0, returnValues, 0, numberOfBytesAfterCompression);
        return returnValues;

    }

    private static byte[] decompress(final byte[] data) {
        final Inflater inflater = new Inflater();
        inflater.setInput(data);
        try (ByteArrayOutputStream outputStream = new ByteArrayOutputStream(data.length)) {
            final byte[] buffer = new byte[Math.max(1024, data.length / 10)];
            while (!inflater.finished()) {
                final int count = inflater.inflate(buffer);
                outputStream.write(buffer, 0, count);
            }
            outputStream.close();
            final byte[] output = outputStream.toByteArray();
            return output;
        } catch (DataFormatException | IOException e) {
            throw new RuntimeException(e);
        }
    }

    public static void main(final String[] args) {
        roundTrip(100);
        roundTrip(1000);
        roundTrip(10000);
        roundTrip(20000);
        roundTrip(30000);
        roundTrip(32000);
        for (int i = 32700; i < 33000; i++) {
            if(!roundTrip(i))break;
        }
    }

    private static boolean roundTrip(final int i) {
        System.out.printf("Starting round trip with size %d: ", i);
        final byte[] data = new byte[i];
        for (int j = 0; j < data.length; j++) {
            data[j]= (byte) j;
        }
        shuffleArray(data);

        final byte[] compressed = compress(data);
        try {
            final byte[] decompressed = CompletableFuture.supplyAsync(() -> decompress(compressed))
                                                         .get(2, TimeUnit.SECONDS);
            System.out.printf("Success (%s)%n", Arrays.equals(data, decompressed) ? "matching" : "non-matching");
            return true;
        } catch (InterruptedException | ExecutionException | TimeoutException e) {
            System.out.println("Failure!");
            return false;
        }
    }

    // Implementing Fisher–Yates shuffle
    // source: https://stackoverflow.com/a/1520212/342852
    static void shuffleArray(byte[] ar) {
        Random rnd = ThreadLocalRandom.current();
        for (int i = ar.length - 1; i > 0; i--) {
            int index = rnd.nextInt(i + 1);
            // Simple swap
            byte a = ar[index];
            ar[index] = ar[i];
            ar[i] = a;
        }
    }
}

这是 ZLib 中的已知错误吗？还是我的压缩/解压缩例程有误？

最佳答案

压缩/解压缩方法的逻辑错误；我在实现方面并不深入，但通过调试我发现了以下内容:

当压缩 32752 字节的缓冲区时，deflater.deflate() 方法返回值 32767，这是您在行中将缓冲区初始化为的大小:

final byte[] bytesCompressed = new byte[Short.MAX_VALUE];

例如，如果您将缓冲区大小增加到

final byte[] bytesCompressed = new byte[4 * Short.MAX_VALUE];

您会看到，32752 字节的输入实际上缩小为 32768 字节。因此在您的代码中，压缩数据不包含应包含在其中的所有数据。

然后当您尝试解压缩时，inflater.inflate() 方法返回零，表示需要更多输入数据。但是，由于您只检查 inflater.finished()，您将陷入无限循环。

因此，您可以增加压缩时的缓冲区大小，但这可能只是意味着遇到更大文件的问题，或者您最好需要重写压缩/解压缩逻辑以分块处理数据。

关于java - ZLib 解压缩在大字节数组上失败，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44284106/

25

4

0

文章推荐： java - Apache Beam 和 CombineFn 的编码器问题

文章推荐： python - Heapq模块实现

文章推荐： java - 在Java中生成另一个整数范围倍数的随机整数

文章推荐： Java Selenium Chrome 驱动程序 - 禁用日志记录

math - 旋转椭圆的 y 解
我希望通过扫描线为 x 的每个值找到 y 的值来绘制椭圆。对于普通椭圆，公式很容易找到:y = Sqrt[b^2 - (b^2 x^2)/a^2] 但是当椭圆的轴旋转时，我一直无法弄清楚如何计算 y
algorithm - 如何在欠定的线性方程组中找到 "partial"解？
假设我有这个矩阵: 1 1 1 | 1 0 0 1 | 1 这个系统显然有无限的解决方案。 x1 = -x2 x3 = 1 x1 依赖于 x2，x2 是免费的，但我感兴趣的是 x3。是否有一种算法可以
neural-network - 如何使用神经网络解决 "soft"解？
我正在考虑使用神经网络在我正在构建的太空射击游戏中为我的敌人提供动力，我想知道；当网络没有一个明确的好的输出集时，你如何训练神经网络？最佳答案我目前正在研究神经网络，如果没有明确定义的输入和输出编
embedded - 对于这种情况，什么是好的(解)压缩例程
我需要一个针对受限资源环境(例如具有以下特征的二进制(十六进制数据)嵌入式系统)进行优化的快速解压缩例程: 数据面向 8 位(字节)(数据总线为 8 位宽)。字节值的范围并不统一为 0 - 0xFF
java - (解)压缩 base64 字符串
PHP代码: $txt="John has cat and dog."; //plain text $txt=base64_encode($txt); //base64 encode $txt=gzd
c - 找到方程的 (x,y) 解
程序从用户那里接收到一个正数k，并且应该检查方程有多少解 3*x+5*y=k 在许多解决方案的情况下，该函数采用所有解决方案中 |x-y| 的较大绝对值。如果只有一种解决方案，它会打印出来。例如: 如
python - odeint 的非线性 ODE 解
我必须求解以下微分方程: 或如果没有 F_1 术语，代码就很简单。但我无法用包含 F_1 项来解决它，尽管我知道解决方案应该看起来像阻尼谐振。 from scipy.integrate import
algorithm - 找到前缀和变化的 O(n) 解
我知道这个问题是前缀和的变体，我只是在设置它时遇到了一些困难。最佳答案定义: P[i] = A[i+1] + A[i+2] + ... + A[n] Q[i] = A[1] + ... + A[i
java - 使用 NIO(解)压缩文件
在许多在线示例中，文件在 Java 中使用编码缓冲区进行(解)压缩。然而，对于 NIO，无需选择一个好的缓冲区大小。我找到了文件和套接字的示例，但是是否有用于压缩输入的 NIO channel (例如
python - 优化三对角系数矩阵的 A*x = B 解
我有一个形式为 A*x = B 的方程组，其中 [A] 是一个三对角系数矩阵。使用 Numpy 求解器 numpy.linalg.solve 我可以求解 x 的方程组。请参阅下面的示例，了解我如何开
java - 最长递增子序列的潜在 O(n) 解
我试图回答这个问题，只使用递归(动态编程) http://en.wikipedia.org/wiki/Longest_increasing_subsequence 从这篇文章中，我意识到最有效的现有解
powershell - Add-Type -ReferencedAssemblies失败，无法加载或找到程序集。解
解决此问题的方法是，按照我发帖的其中一项建议，将DLL添加到GAC中。正如我在我的一份答复中所指出的那样，在需要运行此过程的环境中，可伸缩性将不可用。因此，不能选择简单的解决方案。为了解决这个问题，我
audio - 是否有 AAC-LC(解)压缩的规范？
是否有专门描述 AAC-LC 标准的规范，以及实现编解码器的现实目标，而不是通用编解码器，而是针对特定 AAC-LC 格式，具有预定义的 channel 数和采样率？是否有一些针对 AAC-LC 的
vhdl - 使用通用来确定 VHDL 中的(解)复用器大小？
我想使用通用的“p”来定义多路复用器将有多少输出。输入和所有输出均为 1 位。输出、控制和输入可以很简单，例如: signal control : std_logic_vector(log 2 p
javascript - 定位转换后的 div(三 Angular 解)
我正在尝试在 javascript 中使用一些三 Angular 函数来定位一些菱形 div，但似乎我的逻辑在某处失败了。你可以看到我尝试了这个公式:pos + trig * dimension。我
algorithm - 缺少整数变化 - 需要 O(n) 解
关闭。这个问题需要更多focused .它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 4 年前。 Improve this qu
java - 该对象与 JSON/XML 之间的(解)编码可能会破坏到什么程度
我一直在考虑这两个 JSON 库: 谷歌 Gson JSON.Simple XStream Google Gson 非常棒，它可以序列化具有无参数构造函数的类对象。 JSON.Simple 非常简洁，
gekko - 使用 Gekko 和 Python 拟合数据的数值 ODE 解
使用 Gekko 拟合数据的数值 ODE 解。嗨，大家好! 我想知道是否可以使用 GEKKO 拟合 ODE 的系数。我尝试复制 example given here 失败. 这是我想出的(但有缺陷
java - US-ASCII 字符串(解)压缩到/从字节数组(7 位/字符)
众所周知，ASCII使用7位来编码字符，所以用来表示文本的字节数总是小于文本字母的长度例如: StringBuilder text = new StringBuilder(); In
python - 如何获得与 Matlab 的 'special' (mldivide) 运算符使用 numpy/scipy 返回的欠定线性系统相同的 `A\b` 解？
我找到了一个 link其中显示了一个示例，当线性方程组有无限多个解时，Matlab mldivide 运算符 (\) 给出“特殊”解。例如: A = [1 2 0; 0 4 3]; b = [8;

首页

博学

6Ren·AI

商城

java - ZLib 解压缩在大字节数组上失败