gpt4 book ai didi

unix - 如何在不使用临时文件的情况下合并已排序的文件?

转载 作者:行者123 更新时间:2023-12-04 02:19:42 24 4
gpt4 key购买 nike

我正在尝试使用 sort -m 在 UNIX/Linux 脚本中合并许多已排序的文件,我注意到 sort首先将结果写入临时文件,然后将其复制到目的地。我对-m的理解是因为它假设文件已排序,因此完全没有必要使用临时文件,并且会浪费硬盘空间和 CPU 周期(我在管道中使用 sort,该管道卡住等待排序输出任何内容。)有没有办法告诉sort合并排序文件时不使用临时文件?或者更好的版本没有?

确切的 CL 如下所示:

$ sort -m -s -t '_' -k 1,1n -k 2,2n <(gunzip <file_1) [...] <(gunzip <file_n) | gzip >output

我正在使用 sort来自 GNU coreutils 5.97。

最佳答案

man sort 查看这些选项,它们可能会让您最大限度地减少合并所需的空间量。

--batch-size=NMERGE  

一次最多合并 NMERGE 输入;更多使用临时文件
--compress-program=PROG 

使用 PROG 压缩临时文件;用 PROG -d 解压它们

关于unix - 如何在不使用临时文件的情况下合并已排序的文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6598573/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com