gpt4 book ai didi

python - 单个DataFrame列python/pandas中的groupby逗号分隔值

转载 作者:太空宇宙 更新时间:2023-11-03 12:53:49 25 4
gpt4 key购买 nike

例如,假设我有一个 python pandas DataFrame,如下所示:

#  PERSON  THINGS
0 Joe Candy Corn, Popsicles
1 Jane Popsicles
2 John Candy Corn, Ice Packs
3 Lefty Ice Packs, Hot Dogs

我想使用 pandas groupby 功能来获得以下输出:

THINGS        COUNT
Candy Corn 2
Popsicles 2
Ice Packs 2
Hot Dogs 1

我大致理解以下groupby命令:

df.groupby(['THINGS']).count()

但输出的不是单个项目,而是整个字符串。我想我明白这是为什么,但我不清楚如何最好地解决问题以获得所需的输出而不是以下内容:

THINGS                  PERSON
Candy Corn, Ice Packs 1
Candy Corn, Popsicles 1
Ice Packs, Hot Dogs 1
Popsicles 1

pandas 是否有类似 SQL 中的 LIKE 的功能,或者我正在考虑如何在 pandas 中做错这个?

感谢任何帮助。

最佳答案

通过拆分单词创建一个系列,并使用value_counts

In [292]: pd.Series(df.THINGS.str.cat(sep=', ').split(', ')).value_counts()
Out[292]:
Popsicles 2
Ice Packs 2
Candy Corn 2
Hot Dogs 1
dtype: int64

关于python - 单个DataFrame列python/pandas中的groupby逗号分隔值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51087484/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com