gpt4 book ai didi

dataframe - 如何使用Dask Pivot_table?

转载 作者:行者123 更新时间:2023-12-03 03:38:05 25 4
gpt4 key购买 nike

我正在尝试在 Dask 上使用 Pivot_table 和以下数据框:

    date    store_nbr   item_nbr    unit_sales  year    month
0 2013-01-01 25 103665 7.0 2013 1
1 2013-01-01 25 105574 1.0 2013 1
2 2013-01-01 25 105575 2.0 2013 1
3 2013-01-01 25 108079 1.0 2013 1
4 2013-01-01 25 108701 1.0 2013 1

当我尝试按如下方式操作数据透视表时:

ddf.pivot_table(values='unit_sales', index={'store_nbr','item_nbr'}, 
columns={'year','month'}, aggfunc={'mean','sum'})

我收到此错误:

ValueError: 'index' must be the name of an existing column

如果我只在索引和列参数上使用一个值,如下所示:

df.pivot_table(values='unit_sales', index='store_nbr', 
columns='year', aggfunc={'sum'})

我收到此错误:

ValueError: 'columns' must be category dtype

最佳答案

该错误告诉您 dask dataframe 期望 columns 关键字中使用的列是分类数据类型。它需要这个,以便即使在惰性操作期间也可以正确定义列。您可以按如下方式完成此操作:

df = df.categorize(columns=['year'])

关于dataframe - 如何使用Dask Pivot_table?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49480496/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com