gpt4 book ai didi

python - 根据重复值将 Dataframe 拆分为多个 csv 文件

转载 作者:行者123 更新时间:2023-12-02 03:04:24 28 4
gpt4 key购买 nike

我有一个包含多列的数据集,但只关注名为“VAL”的一列。此列中的每个值的范围从 0 到 4,因此我想根据这些重复值将其拆分为 5 个单独的数据框,然后将每个数据框导出到单独的 csv 文件中。

我已经能够使用 pandas 对数字进行排序,但现在我需要将这些值划分为较小的数据集,请记住我有多个文件,我想这样做,所以可能是一个 for 循环?

this is what I currently have as an output

 A       B      C      D      E      F      G         VAL   FILE
954 380 158 166 431 201 769 0 001.csv
1142 348 203 962 0 878 1023 0 001.csv
1688 279 229 0 488 1007 0 0 001.csv
4792 371 420 29 372 0 745 0 001.csv
2106 352 76 196 388 0 695 0 001.csv
... ... ... ... ... ... ... ...
5634 441 283 277 788 45 585 4 001.csv
827 672 606 24 1023 463 742 4 001.csv
6703 324 203 0 623 214 726 4 001.csv
9056 604 398 0 981 0 633 4 001.csv
0 574 338 144 942 608 793 4 001.csv

this is what I would like it to relatively look like

 A       B      C      D      E      F      G         VAL   FILE
954 380 158 166 431 201 769 0 val_0.csv
1142 348 203 962 0 878 1023 0 val_0.csv
1688 279 229 0 488 1007 0 0 val_0.csv
4792 371 420 29 372 0 745 0 val_0.csv
2106 352 76 196 388 0 695 0 val_0.csv


A B C D E F G VAL FILE
5634 441 283 277 788 45 585 4 val_4.csv
827 672 606 24 1023 463 742 4 val_4.csv
6703 324 203 0 623 214 726 4 val_4.csv
9056 604 398 0 981 0 633 4 val_4.csv
0 574 338 144 942 608 793 4 val_4.csv

最佳答案

更改您的文件以匹配您的预期输出。

df = pd.read_clipboard(sep'\s+')

然后 groupby VAL 并写入您的 csv

for group,data in df.groupby('VAL'):
data.to_csv(f"val_{group}.csv",index=False)

这会根据您的数据为我写入两个 csv。

enter image description here

for group,data in df.groupby('VAL'):
print(data)
A B C D E F G VAL FILE
0 954 380 158 166 431 201 769 0 val_0.csv
1 1142 348 203 962 0 878 1023 0 val_0.csv
2 1688 279 229 0 488 1007 0 0 val_0.csv
3 4792 371 420 29 372 0 745 0 val_0.csv
4 2106 352 76 196 388 0 695 0 val_0.csv
A B C D E F G VAL FILE
6 5634 441 283 277 788 45 585 4 val_4.csv
7 827 672 606 24 1023 463 742 4 val_4.csv
8 6703 324 203 0 623 214 726 4 val_4.csv
9 9056 604 398 0 981 0 633 4 val_4.csv
10 0 574 338 144 942 608 793 4 val_4.csv

关于python - 根据重复值将 Dataframe 拆分为多个 csv 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59340489/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com