gpt4 book ai didi

python - Dask:Dataframe groupBy 上的唯一方法

转载 作者:太空宇宙 更新时间:2023-11-03 11:19:28 27 4
gpt4 key购买 nike

我想知道在使用 Dask 进行 groupBy 聚合后,是否有可能获得给定列中唯一项的数量。我在文档中没有看到类似的内容。它在 pandas dataframe 上可用并且非常有用。我已经看到一些与此相关的问题,但我不确定它是否已实现。

有人可以给我一些提示吗?

最佳答案

展开this comment您可以直接在 SeriesGroupBy 上使用 nunique:

import pandas as pd
import dask.dataframe as dd

d = {'col1': [1, 2, 3, 4], 'col2': [5, 6, 7, 8]}
df = pd.DataFrame(data=d)
ddf = dd.from_pandas(df, npartitions=2)
ddf.groupby(['col1']).col2.nunique().to_frame().compute()

参见 https://github.com/dask/dask/issues/6280进行更多讨论。

关于python - Dask:Dataframe groupBy 上的唯一方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45922884/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com