- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有一个包含林分编号、树种、高度和体积的数据框:
import pandas as pd
df=pd.DataFrame.from_items([('STAND_ID',[1,1,2,3,3,3]),('Species',['Conifer','Broadleaves','Conifer','Broadleaves','Conifer','Conifer']),
('Height',[20,19,13,24,25,18]),('Volume',[200,100,300,50,100,10])])
STAND_ID Species Height Volume
0 1 Conifer 20 200
1 1 Broadleaves 19 100
2 2 Conifer 13 300
3 3 Broadleaves 24 50
4 3 Conifer 25 100
5 3 Conifer 18 10
我想按展台 ID 进行分组和拆分并计算体积加权平均高度,所以我尝试:
newdf=df.groupby(['STAND_ID','Species']).mean().unstack()
Height Volume
Species Broadleaves Conifer Broadleaves Conifer
STAND_ID
1 19.0 20.0 100.0 200.0
2 NaN 13.0 NaN 300.0
3 24.0 21.5 50.0 55.0
高度当然不是体积加权平均值。我怎样才能对它们进行体积加权?对于 STAND_ID 3 和 Conifer,就像这样:
(25*100 + 18*10)/(100+10)=24.4
最佳答案
如果 lambda 函数令人困惑,apply
也可以与函数定义一起使用。 (而且还有一个函数numpy.average
来计算加权平均值)
import numpy as np
def weighted_average(group):
weights = group['Volume']
height = group['Height']
return np.average(height,weights=weights)
df.groupby(['STAND_ID','Species']).apply(func = weighted_average).unstack()
关于python - 加权平均 Pandas ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47181073/
我需要更改利率列的总数。我的意思是,比率列中的总数是汇总,我需要加权平均值而不是总数。例如: 数量…………率 450000.......8.75 390000.......8 15000.......
我有一个包含林分编号、树种、高度和体积的数据框: import pandas as pd df=pd.DataFrame.from_items([('STAND_ID',[1,1,2,3,3,3]),
使用 NumPy 的加权平均值,我希望一个具有无限权重的元素支配结果,但它返回 NaN, >>> np.average([1,2], weights=[np.inf, 1]) nan 这是故意设计的吗
我经常在 Python 列表中添加/删除元组,并且对加权平均值(而不是列表本身)感兴趣。由于与其余部分相比,这部分在计算上非常昂贵,因此我想对其进行优化。跟踪加权平均值的最佳方法是什么?我可以想到两种
创建一个 lambda 函数来计算加权平均值并将其发送到字典。 wm = lambda x: np.average(x, weights=df.loc[x.index, 'WEIGHTS']) # D
我是一名优秀的程序员,十分优秀!