gpt4 book ai didi

linux - 在 vagrant 上排序需要 2 小时 - 大约 100m 行

转载 作者:太空狗 更新时间:2023-10-29 12:02:11 24 4
gpt4 key购买 nike

我可以做些什么来优化这种排序?

我在运行:

mytime="$(time ( cat quotes_2009-04.txt | tr [:space:] '\n' | grep -v "^\s*$" | sort | uniq -c  ) 2>&1 1>/dev/null )"

然后:

echo "$mytime"

得到以下输出:

real    134m0.107s
user 105m27.274s
sys 42m34.889s

这是我正在使用的数据集:

enter image description here

原始数据集的预览:

enter image description here

以下是 vagrant 机器的详细信息:

enter image description here

我可以做些什么来优化这种排序?

最佳答案

将您的数据拆分为多个文件,对每个文件进行并行排序,然后将这些文件合并在一起。见here例如。

关于linux - 在 vagrant 上排序需要 2 小时 - 大约 100m 行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31165955/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com