我到处寻找,但还没有找到适合我的明确解决方案。假设我有下表:
Company or Agency Records Exposed
count sum
0 1-800-Flowers.com 1 Unknown
1 21st Century Oncology 1 2,213,597
2 37th Parallel Properties Investment Group, LLC 1 Unknown
3 4D Sound Diagnostics 1 1,000
4 7-Eleven, Inc. 1 7,832
使用以下查询生成:
companies = data.groupby('Company or Agency')
companies = companies.agg({'Records Exposed': np.sum, 'Company or Agency' : ['count']})
companies = companies.reset_index()
companies = pd.DataFrame(companies)
#companies.sort_values('Company or Agency')
companies.head()
基本上,我想根据“公司或机构数量”列对 DataFrame 进行排序。我怎样才能做到这一点?
看起来agg
函数创建了一个MultiIndex
。引用多索引 DataFrame header 的一种方法是通过元组,因此总而言之,它应该如此简单:
companies.sort_values(by=('Company or Agency', 'count'))
我是一名优秀的程序员,十分优秀!