- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章SQL分组函数group by和聚合函数(COUNT、MAX、MIN、AVG、SUM)的几点说明由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
1 分组聚合的原因 。
sql中分组函数和聚合函数之前的文章已经介绍过,单说这两个函数有可能比较好理解,分组函数就是group by,聚合函数就是count、max、min、avg、sum.
拿上图中的数据进行解释,假设按照product_type这个字段进行分组,分组之后结果如下图.
select product_type from productgroup by product_type
从图中可以看出被分为了三组,分别为厨房用具、衣服和办公用品,就相当于对product_type这个字段进行了去重,确实group by函数有去重的作用.
select distinct product_type from product
假设分组之后,我想看一下价格,也就是sale_price这个字段的值,按照如下这个写法,会报如下错误.
select product_type,sale_price from productgroup by product_type
。
这是为什么呢?原表按照product_type分组之后,厨房用具对应4个值,衣服对应2个值,办公用品对应2个值,这就是在取sale_price这个字段的时候为什么报错了,一个空格中不能填入多个值,这时候就可以用聚合函数了,比如求和,求平均,求最大最小值,求行数。聚合之后的值就只有一个值了.
select product_type,sum(sale_price),avg(sale_price),count(sale_price),max(sale_price) from productgroup by product_type
对于多个字段的分组,其原理是一样的。从上述中记住两点:分组去重和分组聚合.
2 distinct和group by去重的区别 distinct 和group by 设计时侧重点不一样 。
distinct只是为了去重,而group by是为了聚合统计的.
两者都有去重的效果,但是执行的效率不一样 。
单个字段去重 。
--distinctselect distinct product_type from product--group byselect product_type from productgroup by product_type
多个字段去重 。
--distinctselect distinct product_name, product_type from product--group byselect product_name, product_type from productgroup by product_name, product_type
执行效率 。
select <列名1>,<列名2>from<表名>where 查询条件group by 分组类别having 对分组结果指定条件order by <列名> (desc)limit 数字
sql语言的运行顺序,先执行上图中的第一步,然后再执行select子句,最后对结果进行筛选。distinct是在select子句中,而group by在第一步中,所以group by去重比distinct去重在效率上要高.
sql中聚合函数和分组函数 。
the count operator is usually used in combination with a group by clause. it is one of the sql “aggregate” functions, which include avg (average) and sum. 。
count运算符通常与group by子句结合使用。 它是sql“聚合”功能之一,其中包括avg(平均)和sum.
this function will count the number of rows and return that count as a column in the result set. 。
此函数将对行数进行计数,并将该计数作为列返回到结果集中.
here are examples of what you would use count for
以下是将count用于以下用途的示例:
counting all rows in a table (no group by required) 计算表中的所有行(不需要按组) counting the totals of subsets of data (requires a group by section of the statement) 计算数据子集的总数(需要语句的“分组依据”部分) for reference, here is the current data for all the rows in our example student database. 。
作为参考,这是示例学生数据库中所有行的当前数据.
select studentid, fullname, programofstudy, sat_score from student; -- all records with fields of interest this sql statement provides a count of all rows. note that you can give the resulting count column a name using “as”. 。
该sql语句提供所有行的计数。 请注意,您可以使用“ as”为所得的count列命名.
select count(*) as studentcount from student; -- count of all records 。
here we get a count of students in each field of study. 。
在这里,我们得到了每个学习领域的学生人数.
select studentid, fullname, count(*) as studentcount from the student table with a group by programofstudy,
here we get a count of students with the same sat scores. 。
在这里,我们得到了具有相同sat分数的学生人数.
select studentid, fullname, count(*) as studentcount from the student table with a group by sat_score,
here is an example using the campaign funds table. this is a sum total of the dollars in each transaction and the number of contributions for each political party during the 2016 us presidential campaign. 。
这是使用广告系列资金表的示例。 这是2016年美国总统大选期间每笔交易的总金额和每个政党的捐款额.
1
2
3
4
|
select
specific_party, election_year, format(
sum
(total_$),2)
as
contribution$total,
count
(*)
as
numberofcontributions
from
combined_party_data
group
by
specific_party,election_year
having
election_year = 2021;
|
as with all of these things there is much more to it, so please see the manual for your database manager and have fun trying different tests yourself. 。
关于所有这些事情,还有很多事情要做,所以请参阅数据库管理员手册,并尝试自己进行不同的测试,这很有趣.
group by可以根据给定数据列的每个成员对查询结果进行分组统计,最终得到一个汇总表.
group by几个比较重要的约束:
(1)select字句中的列名和having或where中的列名必须为分组列或列函数.列函数对于group by字句定义的每个组返回一个结果 (2)group by一般和聚合函数一使用才有意义,比如count,sum,avg等,使用group by 的两个要素: (3)出现在select后面的字段,要么是聚合函数中的,要么是group by中的. (4)要筛选结果,可以先使用where再用group by或者先用group by再用having 。
第(4)项根据各个数据库不同不一定都能适用,因此最好不要这样用,老老实实用having 。
(一)聚合函数是指对列上的数据进行操作,起到统计的作用。前面的函数都是最一行记录进行操作得到的数据,包括前面的日期函数、数学函数、字符函数、转换函数以及条件判断函数.
常用的聚合函数有:count、sum、avg、max、min。这5个函数个起到统计记录数、求和、求平均值、求最大值、最小值的作用.
count:count函数对查询的数据统计记录数量,这个函数不对字段值为null的值进行统计,也就是说某个查询的字段有null值,则null值的数量会被减除,这样就可以不对null设置查询条件了。 如果要对null值设置查询,则可以用where 字段 is null来作为条件。 sum:sum函数求和,只能对数值型数据操作,也会忽略null值。举例: select sum(考试成绩) as 计算机总成绩 from score where 课号 in (select 课号 from course where 课名=”计算机”) avg:求平均值,参数也必须为数值型字段名或者结果为数值的表达式。 max、min:这两个函数求最大值和最小值,但是不能放到wherer中以及select子句的字段名位置上。 例:select max(x1) from y where max(x2) in(select…) 错误的语法。 select x1 from y where x2=max(x3) 错误的语法。 select max(x1) from y where x2) in(select max(x2,)…) 正确。 注:5个函数都可以使用distinct统计不重复的值: select count(distinct(课程)) as 课程数量 from 课程表 access和mysql不能将distinct放置到参数中,解决方法:查询distinct保存为新表into语句,然后再使用count.
(二)数据分组是指将数据表中的数据按照指定字段的不同值分为很多组,使用group by 子句进行操作.
group by通常不直接查询所有字段并且分组,group by和select后分组字段和查询字段通常一致。因为select * from y group by x 会产生错误,通常对某个字段分组并且利用聚合函数计算分组得到的值。 聚合函数和分组的组合并设置查询条件:可以对一个字段分组并且设定条件,这样得到的结果将会是计算分组并且满足条件的值。例: 查询各个所属院系中所有男生的值: select 所属院系,count(*) as 男生人数from student where 性别='男' group by 所属院系 查询直方图:利用replicate()函数,将分组得到的数据作为次数,重复一个设置的符号。 排序查询结果:order by语句,asc、desc 位于group by之后 case表达式和group by的结合: select 所属院系,count(case when 性别='男' then 1 else null end ) as 男生人数, count(case when 性别='女' then 1 else null end ) as 女生人数 from student group by 所属院系 hanving子句设置分组group by的分组查询条件。 having子句总是和group by子句结合使用,依赖于分组,可以在having中使用聚合函数;where 也可以设定条件,但是不依赖于分组的字段,但是不能使用聚合函数。 select 学号,sum(考试成绩) as 考试总成绩 from score group by 学号 having sum(考试成绩)>400 order by 考试总成绩 desc 。
到此这篇关于sql分组函数group by和聚合函数(count、max、min、avg、sum)的几点说明的文章就介绍到这了,更多相关sql分组函数和聚合函数内容请搜索我以前的文章或继续浏览下面的相关文章希望大家以后多多支持我! 。
原文链接:https://blog.csdn.net/qq_26735495/article/details/110346502 。
最后此篇关于SQL分组函数group by和聚合函数(COUNT、MAX、MIN、AVG、SUM)的几点说明的文章就讲到这里了,如果你想了解更多关于SQL分组函数group by和聚合函数(COUNT、MAX、MIN、AVG、SUM)的几点说明的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
我想做一个平均值:问题是我正在计算每个元素的 AVG 的 1 个项目(工作)但是一旦我想要类别平均值的 GLOBAL 平均值(something and foo) 它不起作用(mysql 向我抛出一个
我使用 MySQL。我有以下格式的数据 - DATE , PAGE , PAGE_LOAD_DURATION , VISIT_TYPE 01-01-15 , A ,
我有下表: +--------+-------+ |Username|Points | +--------+-------+ |User1 | 75.00 | |User1 | 87.50 |
表格: a | b 1 | 15 2 | 10 3 | 20 4 | 30 查询: SELECT AVG(table.b) FROM table ORDER BY table.a ASC LIMIT
这是我的数据库 CREATE TABLE korisnici( name VARCHAR(30) NOT NULL, amount DECIMAL(65,2) ); INSER
这是我的数据库 CREATE TABLE korisnici( name VARCHAR(30) NOT NULL, amount DECIMAL(65,2) ); INSER
我正在尝试获取我的指标的平均交互次数,但此查询获取的是那些进行了交互的人的平均交互次数(那些在 metricsActions 中的人只有在他们已经交互时才会存在,他们的 metricsID 仍然存在于
我与三列有关系:ProductName、CategoryID 和 Price。我需要选择仅那些价格高于给定类别中平均产品价格的产品。(例如,当apple(ProductName)是fruit(Cate
我正在尝试使用 C++ 创建一个简单的程序。它计算用户输入的 5 个数字的平均值,但当我运行它时,它一直给我一个垃圾值。我花了 30 多分钟来解决这个问题,但我似乎无法弄清楚。 #include
总结一个练习题: 我需要从 datetime 列查询平均年份。我最初的解决方案是YEAR(AVG())所有日期。但由于我无法 AVG() 为 datetime,因此我将日期转换为 unix,然后再转换
我想从一个表中的一列 (value_to_count) 获得三个不同的平均值,其中所有这些平均值都有不同的 WHERE 子句(根据时间)。 示例数据: ###services#### Table se
我想创建一个 sql 查询,为 2 个不同的查询一起返回结果。例如,我想要以下形式的结果:产品名称, avg(price), min(price), max(price), avg(order), m
我有以下查询: SELECT ROUND(AVG( p.price ),2) as Avg_value FROM quotes inner join `system_users` ON quotes.
我想在 sql 中使用 AVG 函数来返回某些值的工作平均值(即基于上周而不是整体平均值)。我有两个正在计算的值,体重和 restingHR(心率)。我对每个都有以下 sql 语句: SELECT A
It's difficult to tell what is being asked here. This question is ambiguous, vague, incomplete, over
我有一个包含多个数字列的评论表。我想计算一个查询中所有列的平均值。 如果表格看起来像这样: { foo : 2, bar : 5, foobar : 10 }, { foo :
我正在为我的应用程序使用 SQL Azure SQL Server。我的应用程序直到最近都运行良好,MAX dtu 使用率为 100%,但 AVG DTU 使用率约为 50%。 我应该监控哪个值来扩展
我正在为我的应用程序使用 SQL Azure SQL Server。我的应用程序直到最近都运行良好,MAX dtu 使用率为 100%,但 AVG DTU 使用率约为 50%。 我应该监控哪个值来扩展
这个问题不太可能对任何 future 的访客有帮助;它只与一个较小的地理区域、一个特定的时间点或一个非常狭窄的情况相关,通常不适用于全世界的互联网受众。如需帮助使此问题更广泛适用,visit the
我有下表: Date | Product | Price 06-12-17 | 1.1 | 10 06-12-17 | 1.2 | 2
我是一名优秀的程序员,十分优秀!