gpt4 book ai didi

python - 为数据框python列中的每个唯一值创建excel工作表

转载 作者:行者123 更新时间:2023-12-04 22:28:45 27 4
gpt4 key购买 nike

我有一个非常大的 CSV 文件,其中包含 250,000 多条记录,需要一段时间才能在 Excel 中进行任何分析,因此我想根据我在 pandas 中创建的特定计算列将其拼接到多个工作表中。

特定列称为“Period”,是我的数据框中的一个字符串变量,格式为 MMM_YYYY(例如,Jan_2016、Feb_2016 等)

我正在尝试制作具有工作簿的东西(我们称之为data_by_month.xlsx)在数据框列“Period”中的每个唯一时期都有一个工作表,所有匹配的行都写入相应的工作表中。

这是我尝试过的逻辑:

for row in df:
for period in unique_periods:
if row[38] == period:
with pd.ExcelWriter("data_by_month.xslx") as writer:
df.to_excel(writer, sheet_name = period)

这背后的想法是针对数据帧中的每一行,遍历唯一周期列表中的每个周期,如果 row[38](即 Period 的索引)等于一个周期,则将其写入data_by_month.xlsx 工作簿到特定的工作表中。

我知道我的代码现在完全不正确,但这是我一直在尝试实现的一般逻辑。我很确定我指的是数据框中“期间”列的位置不正确,因为它一直说它超出了范围。任何的建议都受欢迎!

太感谢了!

最佳答案

您应该能够使用 groupby 来实现此目的。在 Pandas 。例如 ...

with pd.ExcelWriter("data_by_month.xlsx") as writer:
for period, data in df.groupby('Period'):
data.to_excel(writer, sheet_name = period)

关于python - 为数据框python列中的每个唯一值创建excel工作表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55227995/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com