gpt4 book ai didi

python - 如何根据第一列的内容拆分一个巨大的 csv 文件?

转载 作者:IT王子 更新时间:2023-10-29 00:02:19 26 4
gpt4 key购买 nike

  • 我有一个超过 250MB 的巨大 csv 文件要上传
  • 文件格式为group_id, application_id, reading 数据可能如下所示
1, a1, 0.1
1, a1, 0.2
1, a1, 0.4
1, a1, 0.3
1, a1, 0.0
1, a1, 0.9
2, b1, 0.1
2, b1, 0.2
2, b1, 0.4
2, b1, 0.3
2, b1, 0.0
2, b1, 0.9
.....
n, x, 0.3(lets say)
  • 我想根据group_id来划分文件,所以输出应该是n个文件,其中n=group_id

输出

File 1

1, a1, 0.1
1, a1, 0.2
1, a1, 0.4
1, a1, 0.3
1, a1, 0.0
1, a1, 0.9

File2
2, b1, 0.1
2, b1, 0.2
2, b1, 0.4
2, b1, 0.3
2, b1, 0.0
2, b1, 0.9
.....

File n
n, x, 0.3(lets say)

我怎样才能有效地做到这一点?

最佳答案

awk 能够:

 awk -F "," '{print $0 >> ("FILE" $1)}' HUGE.csv

关于python - 如何根据第一列的内容拆分一个巨大的 csv 文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9489078/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com