gpt4 book ai didi

dask - 使用多列作为索引来旋转 dask 数据框

转载 作者:行者123 更新时间:2023-12-04 15:36:29 27 4
gpt4 key购买 nike

我有以下格式的 Dask DataFrame:

date       hour device  param     value
20190701 21 dev_01 att_1 0.000000
20190718 22 dev_01 att_2 20.000000
20190718 22 dev_01 att_3 18.611111
20190701 21 dev_01 att_4 18.706083
20190718 22 dev_01 att_5 23.333333

我正在尝试使用 Dask.DataFrames.pivot_table() API 旋转数据框。但是,我想使用“日期”、“小时”和“设备”作为索引(即,在透视表中,每一行都将由日期、小时和设备标识符唯一标识):

ddf.pivot_table(index = ['date', 'hour', 'device'], columns='param', values='value')

但是,它因以下错误而失败:

'index' must be the name of an existing column

据我从 API 文档 (here) 中了解到,参数“index”接受单个列的名称(而不是列表),因此出现此错误。

是否有其他替代方法可以使用多列作为索引来旋转 dask 数据框?

最佳答案

如 docstring 中所述,您所依据的列必须是单个列,并且必须是分类数据类型。因此,要完成您想要的操作,您必须将三列转换为一个分类列。

这可以使用普通的 Pandas 语法实现,但可能需要完全传递数据才能获得类别。

关于dask - 使用多列作为索引来旋转 dask 数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59578760/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com