gpt4 book ai didi

bash - 拆分大型 csv 文件并在每个部分保留标题

转载 作者:行者123 更新时间:2023-11-29 09:10:58 25 4
gpt4 key购买 nike

如何拆分大型 csv 文件(~100GB)并保留每个部分的标题?

例如

h1 h2
a aa
b bb

进入

h1 h2
a aa

h1 h2
b bb

最佳答案

首先你需要分开标题和内容:

header=$(head -1 $file)
data=$(tail -n +2 $file)

然后你要拆分数据

echo $data | split [options...] -

在选项中,您必须指定 block 的大小和结果文件名称的模式。不得删除尾随 -,因为它指定 split 从标准输入读取数据。

然后你可以在每个文件的顶部插入文件头

sed -i "1i$header" $splitOutputFile

您显然应该在 for 循环中执行最后一部分,但其确切代码将取决于为 split 操作选择的前缀。

关于bash - 拆分大型 csv 文件并在每个部分保留标题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37386246/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com