gpt4 book ai didi

python - 根据条件在另一个数据框列上按组计算缺失值的数量

转载 作者:行者123 更新时间:2023-12-05 05:40:13 26 4
gpt4 key购买 nike

假设我有以下数据:

df=pd.DataFrame({"id":[1,1,1,2,2,3,4],
"date":[2019,2019,2020,2020,2020,2020,2021],
"subgroup":["con","ind","ind","con","ind","ind","ind"],
"value":[1,None,2,None,1,3,4]})

我想按 ID 和 DATE 分组,并在这些重复项中,得到一个列,该列根据子组列中的值计算值列中缺失值的数量(在这种情况下,当子组=“Ind” )输出看起来像这样:

id      date    subgroup   value  count
1 2019 con 1 1
1 2019 ind None 1
1 2020 ind 2 0
2 2020 con None 0
2 2020 ind 1 0
3 2020 ind 3 0
4 2021 ind 4 0

我怎样才能做到这一点?

最佳答案

df['counter'] = 0
df.loc[(df.subgroup=='ind') & (df.value.isna()), 'counter'] = 1
df['goal'] = df.groupby(["id","date"])['counter'].transform('sum')
df = df.drop(columns='counter')

但正如 Alollz 指出的那样,您的示例代码不会生成您的示例数据框。

关于python - 根据条件在另一个数据框列上按组计算缺失值的数量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72449311/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com