compression - 如何计算用于放气压缩的良好预设字典-6ren

compression - 如何计算用于放气压缩的良好预设字典

转载作者：行者123 更新时间：2023-12-01 02:24:35

25

4

我有机会为放气压缩预设字典。就我而言，这是有道理的，因为要压缩的数据相对较小，只有 1kb-3kb，而且我有大量代表性示例。要压缩的数据由任意字节序列组成，因此标记化等不是一个好方法。此外，数据显示了很多重复(在数据示例之间)，因此好的字典可能会提供非常好的结果。
问题是如何计算好的字典？是否有计算最佳字典(给定样本数据)的算法？

我开始研究前缀树，但不清楚如何在这种情况下使用它们。

此致，
贾雷克

最佳答案

我不知道有什么算法可以生成最佳的甚至是好的字典。这通常是手工完成的。我认为后缀树是查找字典常用字符串的好方法，但我从未尝试过。

要尝试的第一件事是简单地连接值(value) 32K 的 1-3K 示例，然后看看与没有字典相比能提供多少 yield 。然后你从那里开始处理它，改变示例的顺序或将示例中的重复部分拉到字典的末尾。

请注意，最常见的字符串应该放在最后，因为较短的距离需要较少的位。

关于compression - 如何计算用于放气压缩的良好预设字典，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/17608271/

25

4

0

文章推荐： Heroku 和 Iris 沙发 vs Cloudant

文章推荐： Azure 网站 AppDomain 多次重新启动

compression - zlib: `deflate`和 `compress`函数之间的差异
zlib中的deflate()和compress()函数之间有什么区别？我浏览了在线示例，其中一些使用deflate，而另一些使用compress。我应该如何决定在哪种情况下使用另一种情况？最佳
compression - Compass, config.rb 并实际得到输出 :compressed
这是我的config.rb preferred_syntax = :sass http_path = '/' css_dir = 'css' sass_dir = 'sass' images_dir
database - "COMPRESS FOR ALL OPERATIONS"和 "COMPRESS FOR OLTP"之间的区别？
我正在查看 Oracle 的 OLTP 表压缩(11g 及以上)文档以及在线资源以查找语法并遇到两个不同的版本: COMPRESS FOR ALL OPERATIONS 和 COMPRESS FOR
c# - SharpZipLib : Compressing a single file to a single compressed file
我目前在 .NET 2.0 下使用 SharpZipLib，通过它我需要将单个文件压缩为单个压缩存档。为此，我目前正在使用以下内容: string tempFilePath = @"C:\Users\
org.apache.hadoop.io.compress.zlib.ZlibCompressor.compress()方法的使用及代码示例
本文整理了Java中org.apache.hadoop.io.compress.zlib.ZlibCompressor.compress()方法的一些代码示例，展示了ZlibCompressor.co
Azure Synapse 加载 : Split large compress files to smaller compressed files
我从 Azure Synapse 收到此建议。推荐详情我们检测到您可以通过拆分存储帐户中暂存的压缩文件来提高负载吞吐量。一个好的经验法则是将压缩文件拆分为 60 个或更多，以最大限度地提高负载的并行
戈兰 : "compress/flate" module can't decompress valid deflate compressed HTTP body
这个问题继续讨论开始 here 。我发现 HTTP 响应正文无法被解码为 JSON 对象，因为后者的 deflate 压缩。现在我想知道如何用Golang进行解压。我将不胜感激任何能够显示我的代码中的
css - compression test.min.css 和 compression test.css 的区别
我刚开始为新雇主工作。对于我的上一个雇主，我们使用 LESS 并将其编译为 .css 文件，然后将其压缩为 .min.css 文件。对于我的新雇主，我们也使用 LESS。但是这里我们不仅编译了LESS
go - 为什么使用 unix-compress 和 go compress/lzw 会产生不同的文件，而其他解码器无法读取？
我在终端中使用 compress file.txt 压缩了一个文件并得到了(如预期的那样)file.txt.Z 当我将该文件传递给 Go 中的 ioutil.ReadFile 时， buf0, err
java - Android Studio无法下载commons-compress-1.12.jar，我可以在浏览器上下载commons-compress-1.12.jar并粘贴到gradle上的位置吗？
当我打开Android Studio时，Android Studio将从commons-compress-1.12.jar下载https://jcenter.bintray.com/org/apach
Django-pipeline 'compressed' 不是有效的标签库 : ImportError raised loading pipeline. templatetags.compressed:没有名为 conf 的模块
我收到此错误，但我不知道为什么突然遇到 django-pipeline 问题。我正在 virtualenv 下运行该项目，我尝试使用所需的基本应用程序创建一个新项目，看看它是否可以修复它，但我总是收
java - jar libs\commons-compress-1.18.jar 有一个主类 org.apache.commons.compress.archivers.Lister 与声明的 main 不匹配
已关闭。此问题需要 debugging details 。目前不接受答案。编辑问题以包含 desired behavior, a specific problem or error, and the
compression - 生物信息学压缩核苷酸序列
对于压缩由 fasta 核苷酸序列组成的数据集，推荐的压缩算法是什么(.xz、tar.gz、tar.bz2 等)？此类数据的推荐压缩机制是什么？基于字典的压缩基于自适应字典的压缩基于LZW算法
compression - 任何可查找的压缩库？
我正在寻找一个支持解压期间随机访问的通用压缩库。我想将维基百科压缩成单一的压缩格式，同时我想从中解压/提取个别文章。当然，我可以单独压缩每篇文章，但这不会给出太大的压缩率。我听说 LZO 压缩文件由
compression - 寻找一种快速无损压缩技术
我想压缩一串位，然后我想解压缩它。任何机构都可以通过提及快速无损压缩和解压缩技术来帮助我，如果可能的话，它的编程实现可以帮助我。最佳答案如果您正在寻找速度，那么考虑像 LZ4 这样的快速压缩算法是
compression - 无损图像压缩工具
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。想改进这个问题？将问题更新为 on-topic对于堆栈溢出。 4年前关闭。 Improve this qu
compression - bz2文件压缩问题
当我们压缩一个文件夹时，我们输入命令tar -cjf folder.tar.bz2 folder，它会将整个文件夹压缩到其中。无论如何要压缩文件夹中的所有内容，但该文件夹不应出现在存档中？示例 -
compression - 熵与无损压缩率的关系
来自 Shannon's Source Coding Theorem我们知道压缩字符串的熵受原始字符串熵的限制，如下所示: H(X) <= L < H(X) + 1/N 其中 H(X) 是源字符串的熵
compression - 这个压缩算法有名字吗？
假设您有一个四字节整数，并且您想将其压缩为更少的字节。您可以压缩它，因为较小的值比较大的值更有可能(即，值的概率随其大小而降低)。您应用以下方案来生成 1、2、3 或 4 字节的结果: 请注意，在下面
compression - 读取压缩文件可以比未压缩文件更快吗？
是否有可能使用某种简单算法打包大文件，使我读取数据的速度比未压缩文件快（由于硬盘驱动器比未压缩速度慢）？我需要什么样的压缩率？任何快速压缩算法都能做到吗？最佳答案是。当从硬盘上读取压缩系数为4的

首页

博学

6Ren·AI

商城

compression - 如何计算用于放气压缩的良好预设字典