gpt4 book ai didi

python - 在 Python 中将一个巨大的 CSV 拆分为三个随机文件

转载 作者:行者123 更新时间:2023-11-30 21:50:16 26 4
gpt4 key购买 nike

我有一个巨大的 CSV,我想将其拆分为 3 个大小几乎*相等的随机文件。

*几乎:大小不能被3整除

我正在考虑创建 3 个空白列表,然后在 for 循环中,我会在 range(0,len(mycsv)) 之间随机选择一个数字。并将其附加到每个列表中。然后,我将使用第一个列表中的文件创建一个 csv 并继续。但我认为这会足够慢。有没有比我自己的内置方法或更简单的方法?

最佳答案

对于 csv 的每一行,将此行随机插入到三个空白 csv 文件之一中。对于 100.000 行,应该不会花很长时间。

import random

with open("mycsv.csv") as fr:
with open("1.csv", "w") as f1, open("2.csv", "w") as f2, open("3.csv", "w") as f3:
for line in fr:
f = random.choice([f1, f2, f3])
f.write(line)

关于python - 在 Python 中将一个巨大的 CSV 拆分为三个随机文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24104750/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com