random - 为什么 ZIP 在 System.Random 生成的序列上如此高效

random - 为什么 ZIP 在 System.Random 生成的序列上如此高效 - Kolmogorov 复杂性在哪里？

转载作者：行者123 更新时间：2023-12-02 06:46:01

28

4

我正在生成随机数序列。序列仅包含 0 和 1。我将每个序列放入单独的文本文件中，然后尝试将该文件存档(为 .zip 格式)。我使用 System.Random 生成每个序列的元素。乍一看，这些序列似乎确实是随机的。

奇怪的是，无论生成的 .txt 文件的大小是多少，压缩的 .zip 文件的大小始终等于 .txt 文件大小的相同比例 ~17%。

但从理论上讲，对于真正随机的序列，压缩的 .zip 文件的大小应几乎等于 .txt 文件的大小 - 即，几乎不应该进行压缩。否则，序列至少是部分可预测的(这在这个类似“翻转硬币”的实验中是不可能的)。

所以这意味着我的“归档器”知道如何识别该序列是由 System.Random 中实现的特定伪随机生成器生成的。

我有两个问题:

如何生成存档器无法压缩的伪随机序列？也许有一些已知的技巧？
为什么 17% 的比例如此稳定，并且不依赖于序列的长度(即 .txt 文件的大小)。

感谢您的帮助!

最佳答案

您声明您只在文本文件中保存 0 和 1。因此，在二进制级别，您的文件完全由位序列 00110000 的出现组成。和00110001 (对应于字符 '0' 和 '1' 的 ASCII 值)。这是非常浪费的，一个好的压缩算法会意识到它可以用更少的位数来表示这些 8 位模式中的每一个:最好是 1，但可能是 1 和 2 位的组合以获得约 18% 的压缩比你引用的。

如果要创建无法压缩的序列，则需要生成随机无界值，并将它们作为二进制写入文件。例如:

byte[] buffer = new byte[1024 * 1024];   // for a 1 MB file
(new Random()).NextBytes(buffer);        // each byte gets a random value from 0 to 255
File.WriteAllBytes(target, buffer);

关于random - 为什么 ZIP 在 System.Random 生成的序列上如此高效 - Kolmogorov 复杂性在哪里？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/25828880/

28

4

0

文章推荐： docker - 如何启用实验性 Docker CLI 功能

文章推荐： java - 具有多个 View 的 overridePendingTransition

文章推荐： vb.net - SevenZipSharp 在解压时显示当前解压文件

python - np.random.rand() 或 random.random()
在分析代码时，我偶然发现了以下代码段: msk = np.random.rand(len(df)) < 0.8 变量“msk”和“df”与我的问题无关。经过一些研究，我认为这种用法也与“随机”类有关。
random - random() 似乎不会绘制范围极值
出于几个合理的原因，我必须使用 BSD 的 random() 来生成非常大量的随机数，并且由于它的周期很短(~2^69，如果我没记错的话)，这些数字的质量会降低对于我的用例来说很快。我可以使用我可以访
random - random() 实际上是如何工作的？
每种语言都有一个 random() 函数或类似的东西来生成伪随机数。我想知道下面会发生什么来生成这些数字？我没有编写任何需要这些知识的东西，只是想满足我自己的好奇心。最佳答案唐纳德·克努斯开创性的
python - 为什么 random.random() 占用两个 random.randint() 值？
我开发了一个简单的应用程序来生成测试数据系列，并且我使用随机种子将其构建为能够重复。我注意到以下情况并想知道为什么会这样: >>> random.seed(1) >>> [random.randint
python - 为什么 random() * random() 与 random() ** 2 不同？
random() * random() 和 random() ** 2 有区别吗？ random() 从均匀分布中返回一个介于 0 和 1 之间的值。在测试两个版本的随机平方数时，我注意到了一点不同
python - np.random.rand 与 np.random.random
我发现 Python(及其生态系统)充满了奇怪的约定和不一致，这是另一个例子: np.random.rand Create an array of the given shape and popula
python - Python 中 numpy.random 和 random.random 的性能差异
我想看看哪个随机数生成器包在我的神经网络中速度更快。我目前正在从github上修改一段代码，其中numpy.random和random包都用于生成随机整数、随机选择、随机样本等。我更改此代码的原因
python - Python 中 numpy.random 和 random.random 的区别
我有一个 Python 大脚本。我在其他人的代码中启发了自己，所以我最终使用 numpy.random 模块来做一些事情(例如创建一个从二项分布中获取的随机数数组)，在其他地方我使用模块 random
random - 为什么 JDK 既有 Math.random() 又有 Random 类？
仅仅是因为“大型 API 综合症”还是生成在某些情况下更偏向的随机数？如果是……我认为控制偏见很重要。最佳答案他们是一样的，真的。只是一个方便的方法。检查 javadoc here .此外，您
python - 在 Python3 中使用 `random.shuffle` 作为关键字参数时 `random.random` 的运行时间更短
我只是观察到，当使用 Python3 时，使用 random.shuffle 对列表进行洗牌需要大约一半的运行时间，而当为显式提交函数 random.random >random 关键字参数。我检查
python - 在 python 中，random.uniform() 和 random.random() 有什么区别？
在python中随机模块，random.uniform()和random.random()有什么区别？它们都生成伪随机数，random.uniform() 生成均匀分布的数字，random.rando
random - 在JMeter中生成 'Random number'变量
是否可以在JMeter中生成“随机数”变量？我已经记录了用户旅程我已将旅程导入JMeter 我必须在用户旅程测试用例中输入一个唯一的4位数ID 在jmeter的当前默认值为2323 有没有一种方法
random - FFMpeg random 是否会为连续执行生成相同的伪随机数序列？
例如，如果我执行命令两次:ffmpeg -i input.mp4 -vf geq=r='random(1)*255':g='random(1)*255':b='random(1)*255' -stri
random - System.Random 产生相同的随机数
尽管随机生成器只创建一次，但输出始终是相同的随机结果(对于所有三个测试输出)。来自稍大脚本的测试片段: let myRandGen = System.Random() let getRa
random - IntRange.random()如何在Kotlin中引入熵
我正计划使用IntRange.random()(即(0..9999).random())在 Kotlin 中生成一个随机的5位代码。重要的是，恶意人员不能预测将要生成的数字的顺序。 IntRange.
random - 将随机数生成器种子设置为 "random"数字
您能否告诉我如何将 KDB 中的随机数生成器种子设置为或多或少的“随机”数？我正在尝试执行以下操作: \S .z.i 但不知何故它不起作用。\S 似乎需要一个显式整数，而不是一个变量。非常感谢!
random - 在内核模块中获取/dev/random
我需要同时获得 /dev/random和 /dev/urandom在内核模块中。 get_random_bytes提供获取 /dev/urandom 的 API . 但是/dev/random 没有A
python - random.random 到底在做什么
random.shuffle(lst_shuffle, random.random) 我知道后一部分是可选参数。但它究竟做了什么。我不明白这是什么意思。这是来自文档。 random.random()
python - random.random() 在不同的机器上生成不同的数字
在树莓派 3 上: >>> import random >>> random.seed(0.9849899567458751) >>> random.random() 0.47871160253065
Python:random.random()植入哪里？
说我有一些python代码: import random r=random.random() r的值通常从哪里来？如果我的操作系统没有随机数，那么它将在何处播种呢？为什么不建议将其用于加密？有什么

首页

博学

6Ren·AI

商城

random - 为什么 ZIP 在 System.Random 生成的序列上如此高效 - Kolmogorov 复杂性在哪里？