gpt4 book ai didi

python - pandas - 计算不同分组级别的大小和频率

转载 作者:太空宇宙 更新时间:2023-11-03 17:47:07 25 4
gpt4 key购买 nike

经过一些groupby操作后,我得到了这个结果数据框:

GridCode  User_ID    DLang
3 224591119 es
ja
zh
4 224591119 es
6 146381773 en
9 17925282 ca
63102456 en
106225728 ca
229125779 ca

我想计算每个 GridCode 中每个 DLang 内的 User_ID 数量,构建新列,例如“User_ID_” (DLang)' 生成的数据框将显示为:

GridCode User_ID_es User_ID_ja User_ID_zh ...
3 1 1 1 ...
4 1 0 0 ...
6 0 0 0 ...

到目前为止,我使用 unstuck 方法得到了一些结果,但我知道我不知道如何计算 User_ID 及其频率。

最佳答案

我不确定我明白你想要做什么,也许是这样的?

df.groupby(['GridCode','DLang']).count().unstack().fillna(0)

User_ID
DLang ca en es ja zh
GridCode
3 0 0 1 1 1
4 0 0 1 0 0
6 0 1 0 0 0
9 3 1 0 0 0

关于python - pandas - 计算不同分组级别的大小和频率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29629311/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com