gpt4 book ai didi

python - 按数据帧计算分类数据 Pandas 组

转载 作者:行者123 更新时间:2023-11-28 19:34:01 24 4
gpt4 key购买 nike

我有一个如下所示的数据框:

+---+-----------+----------------+-------+
| | uid | msg | count |
+---+-----------+----------------+-------+
| 0 | 121437681 | eis | 1 |
| 1 | 14403832 | eis | 1 |
| 2 | 190442364 | eis | 1 |
| 3 | 190102625 | eis | 1 |
| 4 | 190428772 | eis_reply | 1 |
| 5 | 190428772 | single_message | 1 |
| 6 | 190428772 | yes | 1 |
| 7 | 190104837 | eis | 1 |
| 8 | 144969454 | eis | 1 |
| 9 | 190738403 | eis | 1 |
+---+-----------+----------------+-------+

我想做的是计算每个 uid 的每个 msg 的实例。

我创建了一个 groupby 对象并找到了所有消息的计数:

grouped_test = test.groupby('uid')
grouped_test.count('msg')

但我不太确定如何计算每个 uid 的每种消息类型。我正在考虑创建掩码和 4 个单独的数据框,但这似乎不是实现此目的的有效方法。

示例数据 - http://www.sharecsv.com/s/16573757eb123c5b15cae4edcb7296e3/sample_data.csv

最佳答案

按 uid 分组并将 value_counts 应用于 msg 列:

>>> d.groupby('uid').msg.value_counts()
uid
14403832 eis 1
121437681 eis 1
144969454 eis 1
190102625 eis 1
190104837 eis 1
190170637 eis 1
190428772 eis 1
single_message 1
yes 1
eis_reply 1
190442364 eis 1
190738403 eis 1
190991478 single_message 1
eis_reply 1
yes 1
191356453 eis 1
191619393 eis 1
dtype: int64

关于python - 按数据帧计算分类数据 Pandas 组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31080383/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com