gpt4 book ai didi

sql-server - 具有别名和 'normal' 数据帧 : python pandas versus mssql 的 Groupby 和 count()

转载 作者:行者123 更新时间:2023-12-05 05:11:21 25 4
gpt4 key购买 nike

来自 SQL 环境,我正在学习 Python Pandas 中的一些东西。我有一个关于分组和聚合的问题。

假设我按年龄类别对数据集进行分组并计算不同的类别。在 MSSQL 中我会这样写:

SELECT AgeCategory, COUNT(*) AS Cnt
FROM TableA
GROUP BY AgeCategory
ORDER BY 1

结果集是一个包含两列的“普通”表,第二列我命名为 Count。

当我想在 Pandas 中做同样的事情时,groupby 对象的格式不同。所以现在我必须重置索引并重命名下一行中的列。我的代码如下所示:

grouped = df.groupby('AgeCategory')['ColA'].count().reset_index()
grouped.columns = ['AgeCategory', 'Count']
grouped

我的问题是这是否可以一次性完成。看来我做的有点过头了,但是我缺乏经验。

感谢您的任何建议。

问候,M.

最佳答案

DataFrame.reset_index中使用参数name :

grouped = df.groupby('AgeCategory')['ColA'].count().reset_index(name='Count')

或者:

grouped = df.groupby('AgeCategory').size().reset_index(name='Count')

区别是 GroupBy.count排除缺失值,GroupBy.size不是。


关于 aggregation in pandas 的更多信息.

关于sql-server - 具有别名和 'normal' 数据帧 : python pandas versus mssql 的 Groupby 和 count(),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55531626/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com