gpt4 book ai didi

python - Pandas - 拆分大型 excel 文件

转载 作者:行者123 更新时间:2023-11-28 21:07:31 25 4
gpt4 key购买 nike

我有一个大约有 500,000 行的 excel 文件,我想将它拆分为多个 excel 文件,每个文件有 50,000 行。

我想用 pandas 来做,这样会是最快和最简单的。

有什么制作方法吗?

谢谢你的帮助

最佳答案

假设您的 Excel 文件只有一个(第一个)包含数据的工作表,我将使用 chunksize 参数:

import pandas as pd
import numpy as np

i=0
for df in pd.read_excel(file_name, chunksize=50000):
df.to_excel('/path/to/file_{:02d}.xlsx'.format(i), index=False)
i += 1

更新:

chunksize = 50000
df = pd.read_excel(file_name)
for chunk in np.split(df, len(df) // chunksize):
chunk.to_excel('/path/to/file_{:02d}.xlsx'.format(i), index=False)

关于python - Pandas - 拆分大型 excel 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41321082/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com