Python - Pandas 将所有其他列的列和统计度量分组为新列-6ren

Python - Pandas 将所有其他列的列和统计度量分组为新列

转载作者：太空狗更新时间：2023-10-30 02:52:47

26

4

我有一个 Pandas 数据框，如下所示:

Voice_Usage | Data_Usage | Revenue | Age | Segment
--------------------------------------------------
300         | 20         | 400     | 35  | 1
700         | 10         | 300     | 40  | 1
100         | 15         | 200     | 32  | 3
150         | 30         | 100     | 20  | 2
450         | 12         | 450     | 54  | 1
900         | 18         | 800     | 17  | 3
...           ...          ...       ...  ...

我想从上面的数据框中导出一个数据框，其中每个 Segment 类型都将包含数据框中的所有变量及其统计度量(最小值、最大值、平均值)。

派生的数据框应该是这样的:

Segment | Variables | Min | Max | Mean |
----------------------------------------
1       Voice_Usage  5     100   50    
1       Data_Usage   0     50    30
1       Revenue      50    1500  300
1       Age          10    80    35
2       Voice_Usage  10    200   70    
2       Data_Usage   10    90    50
2       Revenue      30    500   200
2       Age          15    60    25
3       Voice_Usage  5     100   500    
3       Data_Usage   0     50    30
3       Revenue      50    1500  300
3       Age          10    80    35

...等等。

如何从第一个数据帧中导出第二个数据帧？我按段值分组并聚合了其他变量，但这没有用。我需要让它成为 n 通用的。数据框的变量。

最佳答案

使用melt与 DataFrameGroupBy.agg :

df = (df.melt('Segment', var_name='a')
        .groupby(['Segment','a'])['value']
        .agg(['min','max','mean'])
        .reset_index())
print (df)
    Segment            a  min  max        mean
0         1          Age   35   54   43.000000
1         1   Data_Usage   10   20   14.000000
2         1      Revenue  300  450  383.333333
3         1  Voice_Usage  300  700  483.333333
4         2          Age   20   20   20.000000
5         2   Data_Usage   30   30   30.000000
6         2      Revenue  100  100  100.000000
7         2  Voice_Usage  150  150  150.000000
8         3          Age   17   32   24.500000
9         3   Data_Usage   15   18   16.500000
10        3      Revenue  200  800  500.000000
11        3  Voice_Usage  100  900  500.000000

如果要多个统计使用DataFrameGroupBy.describe :

df = (df.melt('Segment', var_name='a')
        .groupby(['Segment','a'])['value']
        .describe()
        .reset_index())
print (df)
    Segment            a  count        mean         std    min     25%    50%  \
0         1          Age    3.0   43.000000    9.848858   35.0   37.50   40.0   
1         1   Data_Usage    3.0   14.000000    5.291503   10.0   11.00   12.0   
2         1      Revenue    3.0  383.333333   76.376262  300.0  350.00  400.0   
3         1  Voice_Usage    3.0  483.333333  202.072594  300.0  375.00  450.0   
4         2          Age    1.0   20.000000         NaN   20.0   20.00   20.0   
5         2   Data_Usage    1.0   30.000000         NaN   30.0   30.00   30.0   
6         2      Revenue    1.0  100.000000         NaN  100.0  100.00  100.0   
7         2  Voice_Usage    1.0  150.000000         NaN  150.0  150.00  150.0   
8         3          Age    2.0   24.500000   10.606602   17.0   20.75   24.5   
9         3   Data_Usage    2.0   16.500000    2.121320   15.0   15.75   16.5   
10        3      Revenue    2.0  500.000000  424.264069  200.0  350.00  500.0   
11        3  Voice_Usage    2.0  500.000000  565.685425  100.0  300.00  500.0   

       75%    max  
0    47.00   54.0  
1    16.00   20.0  
2   425.00  450.0  
3   575.00  700.0  
4    20.00   20.0  
5    30.00   30.0  
6   100.00  100.0  
7   150.00  150.0  
8    28.25   32.0  
9    17.25   18.0  
10  650.00  800.0  
11  700.00  900.0

关于Python - Pandas 将所有其他列的列和统计度量分组为新列，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/52075311/

26

4

0

文章推荐： python - 傅立叶滤波，回到图像

文章推荐： python - 根据另一个列表中的位置替换列表列表中的所有值

文章推荐： python - 在 Docker 容器中调试 Python

java - 新 PrintWriter(新 BufferedWriter(新 PrintWriter(s.getOutputStream，真)))
我想知道有没有可能做 new PrintWriter(new BufferedWriter(new PrintWriter(s.getOutputStream, true))) 在 Java 中，s
java - 新 ConcurrentHashMap 新 ConcurrentHashMap
我正在尝试使用 ConcurrentHashMap 初始化 ConcurrentHashMap private final ConcurrentHashMap > myMulitiConcurrent
.net - 新{object}与{object} =新{object}
我只是想知道两个不同的新对象初始化器之间是否有任何区别，还是仅仅是语法糖。因此: Dim _StreamReader as New Streamreader(mystream) 与以下内容不同: D
c++ - A* pA = 新 A 之间的差异；和 A* pA = 新 A();
在 C++ 中，以下两种动态对象创建之间的确切区别是什么: A* pA = new A; A* pA = new A(); 我做了一些测试，但似乎在这两种情况下，都调用了默认构造函数，并且只调用了它。
vb.net - xslt.Load(新 XmlTextReader(新 StringReader(xslt))) "xslt compile error"
我已经阅读了其他帖子，但它们没有解决我的问题。环境为VB 2008(2.0 Framework)下面的代码在 xslt.Load 行导致 XSLT 编译错误下面是错误的输出。我将 XSLT 作为字符串
javascript - 警报(新 boolean 值(假))与console.log(新 boolean 值(假))
我想知道为什么alert(new Boolean(false))打印 false 而不是打印对象，因为 new Boolean 应该返回对象。如果我使用 console.log(new Boolean
[新]Java8的新特性
原文首发在我的博客：https://blog.liuzijian.com/post/86955c3b-9635-47a0-890c-f1219a27c269.html 1.Lambda表达式　　
Python装饰器用法实例总结(新)
本文实例讲述了Python装饰器用法。分享给大家供大家参考，具体如下：写装饰器装饰器只不过是一种函数，接收被装饰的可调用对象作为它的唯一参数，然后返回一个可调用对象（就像前面的简单例子）注
r - 在knitr中指定多个同时输出格式(新)
我可以编写 YAML header 来使用 knit 为 R Markdown 文件生成多种输出格式吗？我无法重现 the original question with this title 的答案中
r - 在knitr中指定多种同时输出格式(新)
我可以编写一个YAML标头以使用knitr为R Markdown文件生成多种输出格式吗？我无法重现the original question with this title答案中描述的功能。这个降价
r - 绘制脉冲响应函数(新)
我正在使用vars package可视化脉冲响应。示例: library(vars) Canada % names ir % `$`(irf) %>% `[[`(variables[e])) %>%
c# - 如何对泛型约束类使用方法隐藏(新)
我有一个容器类，它有一个通用参数，该参数被限制到某个基类。提供给泛型的类型是基类约束的子类。子类使用方法隐藏(新)来更改基类方法的行为(不，我不能将其设为虚拟，因为它不是我的代码)。我的问题是"new
java - 找不到符号 = 新
Java 在提示! cannot find symbol symbol : constructor Bar() location: class Bar JPanel panel =
新 Activity 开始后Android跟踪触摸事件
在我的应用程序中，一个新的 Activity 从触摸按钮(而不是点击)开始，而且我没有抬起手指并希望在新的 Activity 中跟踪触摸的 Action 。第二个 Activity 中的触摸监听器不响
ios - 新/相关应用程序的应用程序内公告？
已关闭。此问题旨在寻求有关书籍、工具、软件库等的建议。不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，
Python 在第一行以外的任何行都找不到短语(新)
和我的last question ，我的程序无法检测到一个短语并将其与第一行以外的任何行匹配。但是，我已经解决并回答了。但现在我需要一个新的 def函数，它删除某个(给定 refName )联系人及其
html - (新)制作水平列表
这个问题在这里已经有了答案: Horizontal list items (7 个答案) 关闭 9 年前。
c++ - 新 float
我想创建一个新的 float 类型，大小为 128 位，指数为 4 字节(32 位)，小数为 12 字节(96 位)，我该怎么做输入 C++，我将能够在其中进行输入、输出、+、-、*、/操作。 [我正
c++ - 安置问题 - 新!
我在放置引用计数指针的实例时遇到问题类到我的数组类中。使用调试器，似乎永远不会调用构造函数(这会扰乱引用计数并导致行中出现段错误)! 我的 push_back 函数是: void push_back
c++ - 新/删除运算符不匹配错误有多严重？
我在我们的代码库中发现了经典的新建/删除不匹配错误，如下所示: char *foo = new char[10]; // do something delete foo; // instead of

首页

博学

6Ren·AI

商城

Python - Pandas 将所有其他列的列和统计度量分组为新列