- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我正在编写一个压缩库作为一个小的辅助项目,而且我已经足够了(我的库可以提取任何标准的 gzip 文件,以及产生兼容的(但肯定还不是最佳的)gzip 输出)它是是时候找出一个有意义的区 block 终止策略了。目前,我只是在每 32k 输入(LZ77 窗口大小)后切断 block ,因为它实现起来方便且快速——现在我回过头来尝试真正提高压缩效率。
Deflate spec只有这样说:“当压缩器确定用新鲜树开始一个新 block 是有用的,或者当 block 大小填满压缩器的 block 缓冲区时,压缩器终止一个 block ”,这并不是那么有用。
我整理了 SharpZipLib 代码(因为我认为它是最易读的开源实现),发现它每输出 16k 文字就终止一个 block ,忽略输入。这很容易实现,但似乎必须有一些更有针对性的方法,特别是考虑到规范中的语言“确定用新鲜树开始一个新 block 是有用的”。
那么有人对新策略或现有策略有任何想法吗?
提前致谢!
最佳答案
作为让您前进的建议。
推测性展望,缓冲区大小足以表明卓越的压缩值得改变。
这会改变流式传输行为(在输出发生之前需要输入更多数据)并使刷新等操作显着复杂化。这也是压缩桩中相当大的额外负载。
在一般情况下,只需在可以开始新 block 的每个点进行分支,根据需要递归两个分支,直到采用所有路径,就可以确保产生最佳输出。具有嵌套行为的路径获胜。这对于非平凡的输入大小不太可能可行,因为何时开始新 block 的选择非常开放。
简单地将其限制为最少 8K 的输出文字但防止 block 中超过 32K 的文字将导致尝试推测算法的相对容易处理的基础。称 8K 为子 block 。
其中最简单的是(伪代码):
create empty sub block called definite
create empty sub block called specChange
create empty sub block called specKeep
target = definite
While (incomingData)
{
compress data into target(s)
if (definite.length % SUB_BLOCK_SIZ) == 0)
{
if (targets is definite)
{
targets becomes
specChange assuming new block
specKeep assuming same block as definite
}
else
{
if (compression specChange - OVERHEAD better than specKeep)
{
flush definite as a block.
definite = specChange
specKeep,specChange = empty
// target remains specKeep,specChange as before
but update the meta data associated with specChange to be fresh
}
else
{
definite += specKeep
specKeep,specChange = empty
// again update the block meta data
if (definite is MAX_BLOCK_SIZE)
{
flush definite
target becomes definite
}
}
}
}
}
take best of specChange/specKeep if non empty and append to definite
flush definite.
OVERHEAD 是一些常量,用于说明切换 block 的成本
这是粗略的,可能会有所改进,但如果没有别的,这只是分析的开始。检测有关导致切换的原因的信息的代码,使用它来确定更改可能有益的良好启发式方法(也许压缩率已显着下降)。
这可能导致仅当启发式认为合理时才构建 specChange。如果启发式结果是一个强有力的指标,那么您就可以消除投机性质,并且无论如何都可以简单地决定在该点进行交换。
关于algorithm - 在放气算法中确定 block 大小的一些好的策略是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/484295/
这个问题在这里已经有了答案: C sizeof a passed array [duplicate] (7 个回答) 8年前关闭。 在一个函数中,我声明了一个数组: int char_count_ar
简而言之,文件系统如何与 block 设备通信? 最佳答案 我对 block 大小不太了解。我认为 ext4(Linux)的文件系统的 block 大小是 4KB,考虑到现代处理器的页面大小(4KB)
我知道 tinyint(1) 和 tinyint(2) 具有相同的存储空间范围。 唯一的区别是显示宽度不同。这是否意味着 tinyint(1) 将存储所有类型的整数但只正确显示 0 到 9 的范围?而
今晚我已经研究了以下代码几个小时,但我只是摸不着头脑。 当使用函数从标准输入填充数组时,我不断收到“大小 8 的无效写入”和“大小 8 的无效读取”。 如有任何帮助,我们将不胜感激...我知道 Sta
我有一个 valgrind 错误,我不知道如何摆脱它们: ==5685== Invalid read of size 8 ==5685== at 0x4008A1: main (in /home
我对 Hadoop 的概念有点困惑。 Hadoop block 大小、拆分大小和 block 大小 之间有什么区别? 提前致谢。 最佳答案 block 大小和 block 大小相同。 拆分大小 可能与
我想不出一个好的标题,所以希望可以。 我正在做的是创建一个离线 HTML5 webapp。 “出于某些原因”我不希望将某些文件放在缓存 list 中,而是希望将内容放在 localStorage 中。
无法将 xamarin apk 大小减少到 80 MB 以下,已执行以下操作: 启用混淆器 配置:发布 平台:事件(任何 CPU)。 启用 Multi-Dex:true 启用开发人员检测(调试和分析)
我正在开发一个程序,需要将大量 csv 文件(数千个)加载到数组中。 csv 文件的尺寸为 45x100,我想创建一个尺寸为 nx45x100 的 3-d 数组。目前,我使用 pd.read_csv(
Hello World 示例的 React Native APK 大小约为 20M (in recent versions),因为支持不同的硬件架构(ARMv7、ARMv8、X86 等),而同一应用程
我有一个包含 n 个十进制元素的列表,其中每个元素都是两个字节长。 可以说: x = [9000 , 5000 , 2000 , 400] 这个想法是将每个元素拆分为 MSB 和 LSB 并将其存储在
如何设置 GtKTextView 的大小?我想我不能使用 gtk_widget_set_usize。 最佳答案 您不能直接控制小部件的大小,而是由其容器完成。您可以使用 gtk_widget_set_
这个问题在这里已经有了答案: c++ sizeof() of a class with functions (7 个答案) 关闭 5 年前。 结果是 12。 foobar 函数存储在内存中的什么位置
当我在 ffmpeg(或任何其他程序)中使用这样的命令时: ffmpeg -i input.mp4 image%d.jpg 所有图像的组合文件大小总是比视频本身大。我尝试减少每秒帧数、降低压缩设置、模
我是 clojurescript 的新手。 高级编译后出现“77 KB”的javascript文件是否正常? 我有一个 clojurescript 文件: 我正在使用 leinigen: lein c
我想要一个 QPixmap尺寸为 50 x 50。 我试过 : QPixmap watermark(QSize(50,50)); watermark.load(":/icoMenu/preparati
我正在尝试从一篇研究论文中重新创建一个 cnn,但我对深度学习还是个新手。 我得到了一个大小为 32x32x7 的 3d 补丁。我首先想执行一个大小为 3x3 的卷积,具有 32 个特征和步幅为 2。
我一直在尝试调整 View Controller 内的 View 大小,但到目前为止没有运气。基本上,我的 View 最底部有一个按钮,当方向从纵向更改为横向时,该按钮不再可见,因为它现在太靠下了。
如何使用此功能检查图像的尺寸?我只是想在上传之前检查一下... $("#LINK_UPLOAD_PHOTO").submit(function () { var form = $(this);
我用 C++ 完成了这个,因为你可以通过引用传递参数。我无法弄清楚如何在 JavaScript 中执行此操作。我的代码需要更改什么?我的输出是1 this.sizeOfBst = function()
我是一名优秀的程序员,十分优秀!