gpt4 book ai didi

python - 如何将 .agg 应用于数据框中的前 n 项

转载 作者:太空宇宙 更新时间:2023-11-03 14:29:44 24 4
gpt4 key购买 nike

我正在尝试拉回根据较大数据集的前 4 项计算得出的数据框对象。为此,我提取了创建的数据框census_df,然后编写了以下内容

return (census_df.set_index('STNAME','COUNTY')
.nlargest(4,'CENSUS2010POP')
.groupby(level=0)['CENSUS2010POP']
.agg([{'Sum':np.sum}]))

返回四个最大的县,而不是所有州,其人口由这些州内四个最大的县估计。我尝试使用

return (census_df.set_index('STNAME','COUNTY')
.nlargest(4,'CENSUS2010POP')
.groupby(level=0)['CENSUS2010POP']
.agg([{'Sum':np.argsort()[-3:].sum()}]))

但是 argsort 缺少位置参数,我不确定该放什么——argsort 甚至会引用什么?

最佳答案

IIUC

census_df.set_index('STNAME','COUNTY').\
groupby(level=0)['CENSUS2010POP'].\
agg(lambda x: x.head(4).sum())

关于python - 如何将 .agg 应用于数据框中的前 n 项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47384019/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com