gpt4 book ai didi

python - 根据条件在 groupby 数据框上创建汇总表

转载 作者:太空宇宙 更新时间:2023-11-04 07:52:52 24 4
gpt4 key购买 nike

我有一个 pandas dataframe df 看起来像

userid  trip_id segmentid   actual  prediction
1 13 40 3 3
1 6 2 1 1
1 44 3 2 3
2 70 19 1 1
2 12 5 0 0

我需要创建一个按 userid 列分组的摘要数据框 dfsummary,包含三列 userid、correct_classified、incorrect_classified。如果实际值和预测值相同则分类正确,否则分类错误。

我可以将整个数据帧上的 correct_classfied 算作

correct_classified = submission[(submission['Actual'] == submission['prediction'])]
incorrect_classified = submission[(submission['Actual'] != submission['prediction'])]

但不知道要创建按用户 ID 分组的汇总表,它应该看起来像这样

userid  correct_classified  incorrect_classified
1 2 1
2 2 0

最佳答案

您可以使用 pd.crosstab创建条件数组后:

flags = np.where(df['actual'].eq(df['prediction']), 'correct', 'incorrect')

res = pd.crosstab(df['userid'], flags)

print(res)

col_0 correct incorrect
userid
1 2 1
2 2 0

关于python - 根据条件在 groupby 数据框上创建汇总表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52579551/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com