python - Pandas:按两列分组并以 LONG 格式查找 3 列的第 25、中位数、第 75 个百分位数和平均值-6ren

python - Pandas:按两列分组并以 LONG 格式查找 3 列的第 25、中位数、第 75 个百分位数和平均值

转载作者：行者123 更新时间：2023-11-28 21:36:04

25

4

这个问题在这里已经有了答案:

Pass percentiles to pandas agg function

(12 个回答)

3年前关闭。

这是一个示例数据帧:

df = pd.DataFrame([[1, 1, 10, 11, 12],
                    [1, 1, 13, 14, 15], 
                    [1, 2, 16, 17, 18], 
                    [1, 2, 19, 20, 21],
                    [1, 3, 22, 23, 24], 
                    [1, 3, 25, 26, 27],
                    [1, 4, 28, 29, 30], 
                    [1, 4, 31, 32, 33], 
                    [1, 4, 34, 35, 36],
                    [1, 4, 37, 38, 39],
                    [1, 4, 40, 41, 42]])

df.columns = ['c1', 'c2', 'p1', 'p2', 'p3']
print(df)

给出:

    c1  c2  p1  p2  p3
0    1   1  10  11  12
1    1   1  13  14  15
2    1   2  16  17  18
3    1   2  19  20  21
4    1   3  22  23  24
5    1   3  25  26  27
6    1   4  28  29  30
7    1   4  31  32  33
8    1   4  34  35  36
9    1   4  37  38  39
10   1   4  40  41  42

到目前为止我做了什么:

example = df.groupby(['c1', 'c2'])['p1', 'p2', 'p3'].quantile([0.25, 0.50, 0.75]).unstack().reset_index()

print(example)

给出:

  c1 c2     p1                  p2                  p3             
          0.25   0.5   0.75   0.25   0.5   0.75   0.25   0.5   0.75
0  1  1  10.75  11.5  12.25  11.75  12.5  13.25  12.75  13.5  14.25
1  1  2  16.75  17.5  18.25  17.75  18.5  19.25  18.75  19.5  20.25
2  1  3  22.75  23.5  24.25  23.75  24.5  25.25  24.75  25.5  26.25
3  1  4  31.00  34.0  37.00  32.00  35.0  38.00  33.00  36.0  39.00

我上面的输出是正确的，可以找到百分位数，但我也想要 Average/Mean + 以上格式在 wide格式， 我希望它在 long格式。

所以，

在 wide格式，我想要另一列名为 average

  c1 c2     p1                          p2                              p3             
          0.25   0.5   0.75  average    0.25   0.5   0.75   average     0.25   0.5   0.75   average
0  1  1  10.75  11.5  12.25     X       11.75  12.5  13.25     X        12.75  13.5  14.25    X
1  1  2  16.75  17.5  18.25     X       17.75  18.5  19.25     X        18.75  19.5  20.25    X
2  1  3  22.75  23.5  24.25     X       23.75  24.5  25.25     X        24.75  25.5  26.25    X
3  1  4  31.00  34.0  37.00     X       32.00  35.0  38.00     X        33.00  36.0  39.00    X

我正在寻找的最终输出是上表 long格式如下:

    c1      c2      0.25    0.50    0.75    average      p
    1       1       10.75   11.5    12.25      X         1
    1       1       11.75   12.5    13.25      X         2
    1       1       2.75    13.5    14.25      X         3
    1       2       16.75   17.5    18.25      X         1
    1       2       17.75   18.5    19.25      X         2
    1       2       18.75   19.5    20.25      X         3

我有两个麻烦.. 我不知道如何以及在哪里包含计算 mean 的部分连同 25th, 50th and 75th percentile ，并将其转换为 long格式..

最佳答案

使用 describe :

df.groupby(['c1', 'c2']).describe().stack(level=0)[['25%', '50%', '75%', 'mean']]

关于python - Pandas:按两列分组并以 LONG 格式查找 3 列的第 25、中位数、第 75 个百分位数和平均值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51585660/

25

4

0

文章推荐： python - pandas 中可用于 to_excel 函数的引擎

文章推荐： Python - 导入函数的局部变量

文章推荐： Python Pivot Table margins=True 不能很好地求和

多个条件的 Excel 中位数
基本上在 excel 中，我想要一个表格，就像下面右边给出的那个(我的数据规模比给出的例子大很多)，它有每个主题的中位数，每个条件(例如 TADA、TADP、TPDA , TPDP)。理想情况下，我会
r - 通过排除任何给定的数字来计算平均值，中位数
我有一个大小为5000 * 5000的矩阵，其90％的值为0。是否有现成的解决方案可用来计算排除“0”后该矩阵的均值，中位数？一种粗制解决方案是将所有0更改为NA并使用 median(x, na.
r - 如何计算r中数据框中每组的平均值/中位数
这个问题已经有答案了: Mean per group in a data.frame [duplicate] (8 个回答) 已关闭 9 年前。我有一个数据框，详细记录了客户花了多少钱，如下所示:
python - 如何打印想要的职业的平均值/中位数？
这是我的代码，用于打印所有职业的平均值和中位数。 occupation_lst = ['ALL OCCUPATIONS', 'MANAGEMENT', 'Chief executives', 'Gen
python - 如何找到连续不同值的平均值/中位数？
我的 csv 文件中有一个数据集，如下所示: teacher student student grade Jon marin
c - 不使用数组查找均值、中位数
如何在 C 中不使用数组的情况下找到一组数字的平均值、中位数？问题不是找到平均值或中位数的方法，而是如果不允许使用数组，如何存储一组数字并对它们执行一些操作？最佳答案一个有趣的问题。关键是找到一
sql - 如何找到分组的 SQL 中位数
我正在使用 SQL Server 2008 如果我有这样的表: Code Value ----------------------- 4 240 4 299 4 21
sql - 如何在单个选择查询中获取平均值、中位数、模式和范围？
我正在尝试获取表中一组值的平均值、中位数、众数和范围。我能够得到平均值，但中位数、范围和众数我得到了错误的值。下面是我为上述概念尝试过的代码。 Select CDS.[Commodity_S
sql - 如何在单个选择查询中获取平均值、中位数、模式和范围？
我正在尝试获取表中一组值的平均值、中位数、众数和范围。我能够得到平均值，但中位数、范围和众数我得到了错误的值。下面是我为上述概念尝试过的代码。 Select CDS.[Commodity_S
java - 如何从输入文件中查找平均值、中位数、众数和极差？
我需要从输入文件中查找平均值、中位数、众数和范围。 [input file has the numbers{60,75,53,49,92,71}] 我不知道如何打印范围内的计算结果或计算众数。这很糟
java 中位数。当我有一个带有一对数字的数组时，我得到的中位数不正确
这个问题已经有答案了: Division of integers in Java [duplicate] (7 个回答) 已关闭 7 年前。 public static double calcMed
c# - 中位数 c# 错误计算
当我输入 1,2,3 时我的中位数计算有问题我的中位数是 = 44 我不知道为什么 double wynik = 0; string x1 = textBox1.Text; string[] tab
c++ - 中位数 3 快速排序实现
我的中位数 3 实现在这里运行不正常。我必须为媒体随机选择 3 个数字，这是我的代码，请帮助我。 #include"stdafx.h" #include #include using namespa
linux - 如何从第一列有数字的文件中获取平均数、中位数、均值统计数据？
我有一个文件，其中有如下几秒钟的数字: 0.01033 0.003797 0.02648 0.007583 0.007491 0.028038 0.012794 0.00524 0.019655 0.
java - 如何从一组数字中计算平均值、中位数、众数和范围
是否有任何函数(作为数学库的一部分)可以计算 mean 、中位数、众数和范围来自一组数字。最佳答案是的，似乎确实有第三个库(Java Math 中没有)。出现的两个是: http://opsres
excel - Excel 2010 中的条件聚合/中位数
我目前正在尝试从具有两个条件的一系列数据中提取中位数。本质上相当于下面的 AVERAGEIFS()，我工作得很好。 AVERAGEIFS(): =AVERAGEIFS(Analysis!$F:$F,A
python - 如何用python描述矩阵中的所有二因子列组合(均值、中位数、计数等)？
我有一个 pandas 数据框，看起来像这样: 给定行中的每个值要么是相同的数字，要么是 NaN。我想计算数据框中所有两列组合的平均值、中位数和获取计数，其中两列都不是 NaN。例如，上述数据帧的结
Python/Pandas 用于求解分组均值、中位数、众数和标准差
我有以下数据: [4.1, 4.1, 4.1, 4.2, 4.3, 4.3, 4.4, 4.5, 4.6, 4.6, 4.8, 4.9, 5.1, 5.1, 5.2, 5.2, 5.3, 5.3, 5
用于计算均值、中位数、众数和其他统计数据的 c 库？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭 5 年前。
algorithm - 返回最大化其(均值 - 中位数)的整数子集
一组整数作为输入。您必须返回该集合的子集，以便该子集的均值 - 中位数最大。示例 1 输入 {1,2,3,4} 输出 {1,2,4} 例子2 输入 {1,2,2,3,3} 输出 {2,2,3} 最佳

首页

博学

6Ren·AI

商城

python - Pandas:按两列分组并以 LONG 格式查找 3 列的第 25、中位数、第 75 个百分位数和平均值