gpt4 book ai didi

python - 基于列名称扩展的 DataFrame 列的平均值

转载 作者:行者123 更新时间:2023-12-01 01:06:32 25 4
gpt4 key购买 nike

我在 Jupiter 有一个 DataFrame A,如下所示

Index Var1.A.1  Var1.B.1  Var1.CA.1  Var2.A.1  Var2.B.1  Var2.CA.1
0 1 21 3 3 4 4
1 3 5 4 9 5 1
....
100 9 75 2 4 8 2

我想根据名称的扩展名评估平均值,即

  • .A.1 的平均值
  • .B.1 的平均值
  • .CA.1 的平均值

例如,为了评估扩展名为 .A.1 的变量的平均值,我尝试了以下操作,但它不会返回我要查找的内容

List=['.A.1', '.B.1', '.CA.1']
A[List[List.str.contains('.A.1')]].mean()

但是,通过这种方式,我得到了不同变量的平均值,也得到了 CA.1,这不是它想要的。

有什么建议吗?

谢谢

最佳答案

如果想要通过第一个 之后的所有值对每行进行 meangroupby 与 lambda 函数和 mean 结合使用:

df = df.groupby(lambda x: x.split('.', 1)[-1], axis=1).mean()
print (df)
A.1 B.1 CA.1
0 2.0 12.5 3.5
1 6.0 5.0 2.5
100 6.5 41.5 2.0

关于python - 基于列名称扩展的 DataFrame 列的平均值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55298387/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com