SQL分组函数group by和聚合函数(COUNT、MAX、MIN、AVG、SUM)的几点说明

更新时间:2022-09-27
1 分组聚合的原因 。

sql中分组函数和聚合函数之前的文章已经介绍过,单说这两个函数有可能比较好理解,分组函数就是group by,聚合函数就是count、max、min、avg、sum.

select product_type from productgroup by product_type

从图中可以看出被分为了三组,分别为厨房用具、衣服和办公用品,就相当于对product_type这个字段进行了去重,确实group by函数有去重的作用.

select distinct product_type from product


select product_type,sale_price from productgroup by product_type



select product_type,sum(sale_price),avg(sale_price),count(sale_price),max(sale_price) from productgroup by product_type

2 distinct和group by去重的区别 distinct 和group by 设计时侧重点不一样 。

distinct只是为了去重,而group by是为了聚合统计的.

两者都有去重的效果,但是执行的效率不一样 。

单个字段去重 。

--distinctselect distinct product_type from product--group byselect product_type from productgroup by product_type

多个字段去重 。

--distinctselect distinct product_name, product_type from product--group byselect product_name, product_type from productgroup by product_name, product_type

执行效率 。

select <列名1>,<列名2>from<表名>where 查询条件group by 分组类别having 对分组结果指定条件order by <列名> (desc)limit 数字

sql语言的运行顺序,先执行上图中的第一步,然后再执行select子句,最后对结果进行筛选。distinct是在select子句中,而group by在第一步中,所以group by去重比distinct去重在效率上要高.


sql中聚合函数和分组函数 。

the count operator is usually used in combination with a group by clause. it is one of the sql “aggregate” functions, which include avg (average) and sum. 。

count运算符通常与group by子句结合使用。 它是sql“聚合”功能之一,其中包括avg(平均)和sum.

this function will count the number of rows and return that count as a column in the result set. 。


here are examples of what you would use count for


counting all rows in a table (no group by required) 计算表中的所有行(不需要按组) counting the totals of subsets of data (requires a group by section of the statement) 计算数据子集的总数(需要语句的“分组依据”部分) for reference, here is the current data for all the rows in our example student database. 。


select studentid, fullname, programofstudy, sat_score from student; -- all records with fields of interest this sql statement provides a count of all rows. note that you can give the resulting count column a name using “as”. 。

该sql语句提供所有行的计数。 请注意,您可以使用“ as”为所得的count列命名.

select count(*) as studentcount from student; -- count of all records 。

here we get a count of students in each field of study. 。


select studentid, fullname, count(*) as studentcount from the student table with a group by programofstudy,

here we get a count of students with the same sat scores. 。


select studentid, fullname, count(*) as studentcount from the student table with a group by sat_score,

here is an example using the campaign funds table. this is a sum total of the dollars in each transaction and the number of contributions for each political party during the 2016 us presidential campaign. 。

这是使用广告系列资金表的示例。 这是2016年美国总统大选期间每笔交易的总金额和每个政党的捐款额.

select specific_party, election_year, format( sum (total_$),2) as contribution$total, count (*) as numberofcontributions
from combined_party_data
group by specific_party,election_year
having election_year = 2021;

as with all of these things there is much more to it, so please see the manual for your database manager and have fun trying different tests yourself. 。



group by可以根据给定数据列的每个成员对查询结果进行分组统计,最终得到一个汇总表.

group by几个比较重要的约束:

(1)select字句中的列名和having或where中的列名必须为分组列或列函数.列函数对于group by字句定义的每个组返回一个结果 (2)group by一般和聚合函数一使用才有意义,比如count,sum,avg等,使用group by 的两个要素: (3)出现在select后面的字段,要么是聚合函数中的,要么是group by中的. (4)要筛选结果,可以先使用where再用group by或者先用group by再用having 。

第(4)项根据各个数据库不同不一定都能适用,因此最好不要这样用,老老实实用having 。




count:count函数对查询的数据统计记录数量,这个函数不对字段值为null的值进行统计,也就是说某个查询的字段有null值,则null值的数量会被减除,这样就可以不对null设置查询条件了。 如果要对null值设置查询,则可以用where 字段 is null来作为条件。 sum:sum函数求和,只能对数值型数据操作,也会忽略null值。举例: select sum(考试成绩) as 计算机总成绩 from score where 课号 in (select 课号 from course where 课名=”计算机”) avg:求平均值,参数也必须为数值型字段名或者结果为数值的表达式。 max、min:这两个函数求最大值和最小值,但是不能放到wherer中以及select子句的字段名位置上。 例:select max(x1) from y where max(x2) in(select…) 错误的语法。 select x1 from y where x2=max(x3) 错误的语法。 select max(x1) from y where x2) in(select max(x2,)…) 正确。 注:5个函数都可以使用distinct统计不重复的值: select count(distinct(课程)) as 课程数量 from 课程表 access和mysql不能将distinct放置到参数中,解决方法:查询distinct保存为新表into语句,然后再使用count.

(二)数据分组是指将数据表中的数据按照指定字段的不同值分为很多组,使用group by 子句进行操作.

group by通常不直接查询所有字段并且分组,group by和select后分组字段和查询字段通常一致。因为select * from y group by x 会产生错误,通常对某个字段分组并且利用聚合函数计算分组得到的值。 聚合函数和分组的组合并设置查询条件:可以对一个字段分组并且设定条件,这样得到的结果将会是计算分组并且满足条件的值。例: 查询各个所属院系中所有男生的值: select 所属院系,count(*) as 男生人数from student where 性别='男' group by 所属院系 查询直方图:利用replicate()函数,将分组得到的数据作为次数,重复一个设置的符号。 排序查询结果:order by语句,asc、desc 位于group by之后 case表达式和group by的结合: select 所属院系,count(case when 性别='男' then 1 else null end ) as 男生人数, count(case when 性别='女' then 1 else null end ) as 女生人数 from student group by 所属院系 hanving子句设置分组group by的分组查询条件。 having子句总是和group by子句结合使用,依赖于分组,可以在having中使用聚合函数;where 也可以设定条件,但是不依赖于分组的字段,但是不能使用聚合函数。 select 学号,sum(考试成绩) as 考试总成绩 from score group by 学号 having sum(考试成绩)>400 order by 考试总成绩 desc 。

