gpt4 book ai didi

hadoop - 何时使用压缩

转载 作者:可可西里 更新时间:2023-11-01 16:07:08 26 4
gpt4 key购买 nike

问题在标题中——什么时候使用压缩比较好?好的,我的意思是处理速度更快。

我的管道由多个 MR 作业组成,中间结果存储在序列文件中。

数据是数字 - 时间序列。此外,碰巧一项工作的输出与输入的大小相同。因此,传输/存储的数据可能很大。

我想知道我是否可以预期由于压缩而加速,或者压缩/解压缩数据需要更多时间?

最佳答案

使用快速编解码器(read snappy)启用中间数据压缩几乎总是一个好主意。即使您的数据不可压缩,您也不会受到太多惩罚。

关于hadoop - 何时使用压缩,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35419267/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com