python - python : How to get the average of the n largest values for each column grouped by id-6ren

python - python : How to get the average of the n largest values for each column grouped by id

转载作者：太空宇宙更新时间：2023-11-04 11:07:36

25

4

我试图在按 id 分组时获取每列的平均值。但是我没有让它按照我想要的方式工作。

数据:

ID       Property3   Property2   Property3
1        10.2        ...         ...
1        20.1
1        51.9
1        15.8
1        12.5
...
1203     104.4
1203     11.5
1203     19.4
1203     23.1

到目前为止我得到了什么:
我得到了那两次尝试。但它们都只用于一个专栏，我不知道如何为更多专栏做。:

data.groupby('id')['property1'].apply(lambda grp: grp.nlargest(100).mean())
1       37.897989
2       33.059432
3       34.926530
4       33.036137

data.groupby('id').agg({'property1': {lambda grp: grp.nlargest(100).mean()}})
id  property1 <lambda>
1   37.897989
2   33.059432
3   34.926530
4   33.036137

我想要什么:
理想情况下，我希望有一个数据框如下:

ID       Property3   Property2   Property3
1        37.8        5.6         2.3
2        33.0        1.5         10.4
3        34.9        91.5        10.3
4        33.0        10.3        14.3

因此每一行都包含按 id 分组的每个列的 100 个最大值的平均值。

最佳答案

使用GroupBy.agg省略列以处理 DataFrame 中没有 ID 的所有列:

df = data.groupby('ID').agg(lambda grp: grp.nlargest(100).mean()).reset_index()

print (df)
       ID  Property1  Property2  Property3
0     1.0       22.1       ...       ...
1  1203.0       39.6       ...       ...

或者在groupby之后指定列:

df = (data.groupby('ID')['Property1','Property2','Property3']
          .agg(lambda grp: grp.nlargest(100).mean())
          .reset_index())

关于python - python : How to get the average of the n largest values for each column grouped by id，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59067194/

25

4

0

文章推荐： CSS transform Scale 平移对象，如何避免？

文章推荐： c - 无法运行共享内存程序

文章推荐： java - 无法从 JAR 文件获取带注释的值

文章推荐： javascript - 根据多种条件处理不同颜色的文本

average - 关于reduce part of RavenDB index, average calculation的语法问题
我正在努力寻找平均列的正确语法。我所拥有的——来自 RavenDB Studio 编辑器: map : from area in docs.Level5_AdministrativeAreas sel
java - 为什么 IntStream.average() 总是返回正确的结果而 LongStream.average() 有时却不能？
double average = LongStream .of(-4480186093928204294L, -1340542863544260591L, -600429628624003927
php - 梦幻足球: Compare a team's average points to the league average?
我在 MySQL 表中有梦幻足球联赛的数据。我想查询一个 php 页面的数据。我如何创建一个查询来计算球队得分与该特定年份联盟平均得分的比较？我的(简化的)数据表如下所示: 游戏 table :
javascript - 关于 "var avg = array.average()"中 array.average() 功能的混淆
干杯，伙计们。我被要求让这段代码在学习挑战中发挥作用，但我不确定如何处理“array.average()”部分，因为它不是一个函数。我被问到的是: var array = [5,44,23,11,5
java - 数组和搜索算法 : How is the "average N/2 steps to search an array" average value calculated?
我刚刚开始学习 Java 中的数据结构和算法(从数组开始)。我有两个问题。在我看来，算法执行中的“步骤”是实际上是算法访问的数组的位置。因为他们说数组中的插入一步发生，因为数据项被简单地插入到第一个
php - 如何使用谷歌分析 api 获取 'average session duration' 和 'Average pages viewed per visit'
嗨，我正在使用谷歌分析 api gapi查找网站的“平均 session 持续时间”和“每次访问浏览的平均页面” 我为此创建了一个仪表板，其值为 00:02:30和 4.58分别 ... 我使用以下代
sql - MySQL 查询 : work out the average rating for each user then order the results by average rating and number of ratings
SELECT username, (SUM(rating)/count(*)) as TheAverage, count(*) as TheCount FROM ratings WHERE month
excel - Office Excel平均函数: what's the difference between AVERAGE(A2:C2 B1:B10) and AVERAGE(A2:C2, B1 :B10)?
在 Office Excel AVERAGE 函数示例中，参数始终使用逗号作为分隔符。但是，AVERAGE(A2:C2 B1:B10) 在 Excel 中也有效。我的问题:有什么区别以及为什么？谢谢
python - (对于循环): How to put average values beside each number of the corresponding avg value and print the number(s) with the highest average?
我的代码: name = ["AAAAA 4 2 1 2 4 2 4 4 5 2 2 1 5 2 4 3 1 1 3 3 5", "BBB 5 2 1 2 4 5 4 4 1 2 2 2 4 4
android - 火力地堡分析 : Show Average of 'Value' Parameter and average of time like 'hh:mm:ss' in the Console for events sent from Android app
我一直在探索适用于 Android 的 Firebase Analytics，发现控制台的仪表板显示用户参与事件，该事件显示平均屏幕时间，如“hh:mm:ss”，还通过获取以下总和来显示“值”参数的平
average - 计算平均评分
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它，visit the help center 。已关
average - 平均倍数变化的问题
我使用维基百科文章中定义的折叠更改: http://en.wikipedia.org/wiki/Fold_change 我现在处理倍数变化已经有一段时间了，但从来没有真正需要计算我所有倍数变化的平均倍
计算两种颜色的 "average"
这仅与编程相关 - 与颜色及其表示有更多关系。我正在开发一个非常底层的应用程序。我在内存中有一个字节数组。那些是字符。它们是用抗锯齿渲染的:它们的值从 0 到 255，0 表示完全透明，255 完全
average - NetLogo:查找一组海龟的平均值
我正在尝试在用户界面中实现一个监视器，该监视器显示由海龟品种(海龟自己)共享的变量的平均值。有谁知道收集所有值的方法，将它们加在一起并除以海龟的数量以获得值或知道更简单的方法？最佳答案如果每只海龟
math - "Average"多个四元数？
我试图在我的 OpenGL 程序中将骨架动画从矩阵切换到四元数，但我遇到了一个问题: 给定多个单位四元数，我需要得到一个四元数，当用于变换向量时，将给出一个向量，该向量是每个四元数单独变换的向量的平均
moving-average - Clickhouse移动平均线
输入: Clickhouse 表A business_dttm(日期时间) 金额( float ) 我需要在每个 business_dttm 上计算 15 分钟(或最后 3 条记录)的移动总和例如
moving-average - 如何在不保留计数和数据总计的情况下计算移动平均线？
我正在尝试找到一种方法来计算移动累积平均值，而不存储迄今为止收到的计数和总数据。我想出了两种算法，但都需要存储计数: 新平均值 = ((旧计数 * 旧数据) + 下一个数据)/下一个计数新平均值
mysql - 如何优化SQL an/average(a)？
在我的 SQL 脚本中，我想标准化来自这样的子查询的值 select y/avg(y) from ( select x*z as y from test_table )T 我知道这个解决方案会起
python - 获取同一文件的多个随机损坏副本的 "average"
由于 Controller 损坏，文件在从 USB 闪存驱动器下载时会随机损坏。我下载了同一个文件的多个副本，每个副本的错误似乎通常是唯一且随机的。因此，我需要一个脚本来比较同一文件的几个(3 到
algorithm - Average-case算法分析
我正在尝试解决一个非常简单的算法分析(显然对我来说不是那么简单)。算法是这样的: int findIndexOfN(int A[], int n) { // this algorithm looks

首页

博学

6Ren·AI

商城

python - python : How to get the average of the n largest values for each column grouped by id