gpt4 book ai didi

bash - 如何将大型 tar.gz 文件的内容通过管道传输到 STDOUT?

转载 作者:行者123 更新时间:2023-11-29 08:49:50 25 4
gpt4 key购买 nike

我有一个包含大约 100 万个文件的 large.tar.gz 文件,其中大约 1/4 是 html 文件,我想解析每个文件的几行html 文件。

我想避免将大型 large.tar.gz 的内容提取到文件夹中然后解析 html 文件,相反我想知道如何通过管道传输large.tar.gz 中的 html 文件直接发送到 STDOUT 以便我可以 grep/解析出我想要的信息?

我想一定有一些魔法,比如:

tar -special_flags large.tar.gz | grep_only_files_with_extension html | xargs -n1 head -n 99999 | ./parse_contents.pl -

有什么想法吗?

最佳答案

将其与 GNU tar 一起使用以将 tgz 提取到标准输出:

tar -xOzf large.tar.gz --wildcards '*.html' | grep ...

-O, --to-stdout: extract files to standard output

关于bash - 如何将大型 tar.gz 文件的内容通过管道传输到 STDOUT?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34176788/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com