gpt4 book ai didi

multithreading - 如何并行使用Linux “cut”

转载 作者:行者123 更新时间:2023-12-03 13:04:39 26 4
gpt4 key购买 nike

我有一个大的制表符分隔文件(10TB)。

我想按某些列削减文件,我想使用我的24个内核中的每一个并行执行此操作。

cut -f1,2,3 file > out

关于如何使用多个内核或并行执行此操作的任何想法?

我有一些想法
cat file | parallel --round-robin --pipe  "cut -f1 1,2,3"  > out

cat file | parallel --round-robin --pipe --block 1000000k "cut -f1 1,2,3" > out

最佳答案

IF磁盘不是限制因素(但CPU是限制因素):

parallel -k --pipepart -a big.tsv --block 1g cut -f1 1,2,3 > out

关于multithreading - 如何并行使用Linux “cut”,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29924983/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com