gpt4 book ai didi

pandas - 在 'groupby()' 和 'value_counts() 函数之后选择每组的第一行

转载 作者:行者123 更新时间:2023-12-02 00:22:48 24 4
gpt4 key购买 nike

我有一个名为 new_data_set 的数据集,如下所示:

Image

我想找到每年出现次数最多的流派。

所以我这样做了:

new_data_set.groupby('release_year')['genre']).apply(lambda x: x.value_counts())`

结果如下:result

现在我需要从每个组中获取第一行以获得答案。所以结果应该是这样的:

1960 Drama
1961 Drama
.
.

我应该怎么做?

最佳答案

添加index[0] 然后reset_index :

new_data_set = pd.DataFrame({
'release_year':[2004,2005,2004,2005,2005,2004],
'genre':list('aaabbb')
})

df = (new_data_set.groupby('release_year')['genre']
.apply(lambda x: x.value_counts().index[0])
.reset_index()
)
print (df)
release_year genre
0 2004 a
1 2005 b

关于pandas - 在 'groupby()' 和 'value_counts() 函数之后选择每组的第一行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54839391/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com