gpt4 book ai didi

计算条件均值和方差的Python方法?

转载 作者:行者123 更新时间:2023-11-28 17:32:54 26 4
gpt4 key购买 nike

Python 中是否有一种标准方法来计算 pandas DataFrame 变量的条件均值和方差?目的是测试数据的过度分散或欠分散,作为评估泊松或负二项式模型是否最适合回归的先决条件。

扫描 R 生态系统和交叉验证,我认为 R 有一些带有内置参数分散方法的包。但我在 pandas、SciPy 或 StatsModels 中找不到 Python 等效项。

这是我正在处理的数据的头部。有 25,000 个观察值。

aspunet c_#     c_++    Ruby    java
0 0 0 0 6
11 0 0 0 0
0 0 7 0 0
0 0 0 9 0
8 0 0 0 0
0 2 0 0 0
0 0 0 4 0
0 0 0 0 6

最佳答案

conditional = [df.groupby(col_name) for col_name in df.columns]
mean = [cond.mean() for cond in conditional]
var = [cond.var() for cond in conditional]

关于计算条件均值和方差的Python方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33085184/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com