根据mysql的执行顺序来写select

过滤顺序指的是mysql的逻辑执行顺序,个人觉得我们可以按照执行顺序来写select查询语句。

一、执行顺序

  1. FROM子句
    这是执行的第一步,数据库系统读取指定的表和视图,这是后续所有操作的基础。

  2. JOIN
    如果涉及多个表,则基于JOIN条件,将表中的行组合起来。

  3. WHERE子句:对行的过滤
    接下来,数据库系统会过滤掉不符合WHERE条件的行。这是在聚集函数(如COUNT、SUM等)应用之前进行的,因此只作用于原始数据。
    WHERE 子句后面不能直接接聚合函数(如 COUNT(), MAX(), SUM() 等)。WHERE 子句用于指定从基础数据表中选择哪些行的标准,这些标准必须是能够对每一行单独评估的布尔表达式。由于聚合函数是在行群(group)上操作的,而不是单独的行上,所以它们不能直接在 WHERE 子句中使用。
    总之,是对原始数据的每一行进行操作!!!没法联系多行进行判断,所以不能用聚集函数!!!!!

  4. GROUP BY子句
    将之前得到的结果集按照指定的列值进行分组,为聚集函数(如COUNT、SUM等)的应用做准备。

  5. HAVING子句:对组的过滤
    与WHERE类似,但它是在聚集函数应用后对分组的结果进行过滤,相比于where,涉及到了多行,所以可以使用聚集函数。
    可以简单理解成:where过滤掉行,having过滤掉组,均是接的布尔表达式。
    没有 GROUP BY 的上下文中单独使用 HAVING 是不常见的,而且可能不被所有SQL数据库支持。

  6. SELECT
    选取指定的列。
    如果使用了聚集函数,那么非聚集列必须出现在GROUP BY子句中,除非它们在聚集函数内部。比如使用了select max(num),它将从每一组中找到一个最大的num,而不是整张表中找
    关于增加一列:根据条件显示内容

    case
    	when 条件1(布尔表达式) then 满足条件1要展示的结果
    	when 条件2(布尔表达式) then 不满足条件1满足条件2的结果
    	else 都不满足的结果
    end as 别名
    

二、小tips

  1. 子查询作为数据源,必须有别名,如果是在where、having语句中,则不拥有。

  2. 聚集函数嵌套的问题:
    不允许直接嵌套聚合函数:聚合函数(如AVG(), SUM(), MAX()等)通常不允许直接嵌套使用。也就是说,一个聚合函数的结果不能直接成为另一个聚合函数的输入,如MAX(COUNT(column))是不允许的。
    允许聚合结果被其他函数处理:聚合函数的结果可以被其他非聚合函数处理,如ROUND(AVG(column), 2)是允许的。这是因为ROUND函数在这里不是在进行聚合操作,而是在对聚合操作的单一结果值进行格式化或转换。

三、案例

假设目前数据库有一个表nums:

CREATE table nums(
	num INTEGER
);

插入样本数据:

insert into nums(num)
values
	(8),
	(8),
	(3),
	(3),
	(1),
	(2),
	(5),
	(6);

任务:找到nums表中出现次数最多的数字,如有多个,展示最大的结果。

下面开始按照过滤顺序具体实现:
我们将任务拆分为三轮:
第一轮:统计每个num的出现次数
第二轮:计算最多次数
第三轮:找到所有出现次数为最多次数的所有数字,并找到这些数字中的最大值
在每一轮中,将按照执行顺序一步步书写语句:

  1. FROM
  2. JOIN
  3. WHERE
  4. GROUP BY
  5. HAVING
  6. SELECT
  7. DISTINCT
  8. ORDER BY
  9. LIMIT / OFFSET

强调一下,每一步操作都是基于前面执行的结果再操作的,比如where就只会对原始from和join后的结果对行进行过滤,不会对group by的结果做过滤,这一点很重要!!!

第一轮查询:统计每个num的出现次数

  1. FROM:找到表nums
	from nums
  1. JOIN
    不需要涉及多个表,略。
  2. WHERE
    不需要过滤掉任何行,所以略。
  3. GROUP BY
    需要找到每个数字出现的次数,自然需要分组,根据num分组:
	from nums
	group by num
  1. HAVING
    不需要略掉任何组,所以略。
  2. SELECT
    需要得到统计结果:
	select count(num) as frequency
	from nums
	group by num

这里起一个别名,因为后续查询里,这个数字需要被用到,所以记得取别名
7. DISTINCT

8. ORDER BY

9. LIMIT / OFFSET

第二轮查询:计算最多次数

  1. FROM
    这里需要找到出现次数中的最大值,所以第一轮查询的结果,将作为这一轮查询的数据源。
from(
	select count(num) as frequency
	from nums
	group by num
	) table_temp

根据前面小tips的第一条,子查询的结果如果是作为数据源,那么一定要取别名,否则会报错,别名前面可加as,也可以不加。
2. JOIN
不需要,略。
3. WHERE
虽然需要找到最高次数,看似可以在这一步对行级过滤,但是where对每一行操作时,只能看到当前行的数据,所以它不能使用max这种聚集函数得到全表的最大值,所以这一步略。
4. GROUP BY
不需要再分组了,略。
5. HAVING
没有分组了,所以它略。
6. SELECT
找到最大值,所以增加select max(frequency)

select max(frequency)
	from(
	select count(num) as frequency
	from nums
	group by num
	) as table_temp
  1. DISTINCT
  2. ORDER BY
  3. LIMIT / OFFSET

第三轮查询:找到所有出现次数为最多次数的所有数字,并找到这些数字中的最大值

  1. FROM
    是对全表进行查询,找到出现次数为最大次数的结果,所以数据源是全表。
from nums
  1. JOIN
    略。
  2. WHERE
    无法对原始数据直接做过滤,因为此时还不能从第一步得到的结果中知道每个数字的次数,所以略。
  3. GROUP BY
    为得到次数,再一次做分组
from nums
group by num
  1. HAVING
    对每一组做过滤,保留次数等于最大次数的组,判断的条件是count(num)=最大次数,最大次数为第二轮查询的结果,所以将结果嵌套进来:
from nums
group by num
having count(num)=(
select max(frequency)
	from(
	select count(num) as frequency
	from nums
	group by num
	) as table_temp
)
  1. SELECT
    目前得到了多个组结果,每个组的数字都满足出现次数等于最大次数,将数字选出来,即使用select num
select num
from nums
group by num
having count(num)=(
select max(frequency)
	from(
	select count(num) as frequency
	from nums
	group by num
	) as table_temp
)
  1. DISTINCT
    不需要去重,略。
  2. ORDER BY
    为了找到最大值的结果,对目前的num结果降序,增加order by num desc
select num
from nums
group by num
having count(num)=(
select max(frequency)
	from(
	select count(num) as frequency
	from nums
	group by num
	) as table_temp
)
order by num desc
  1. LIMIT / OFFSET
    选择排序第一的结果limit 1,它是最大值
select num
from nums
group by num
having count(num)=(
select max(frequency)
   from(
   select count(num) as frequency
   from nums
   group by num
   ) as table_temp
)
order by num desc
limit 1

计算结果展示:

在这里插入图片描述

补充说明

关于为什么要拆分步骤一和步骤二,为什么不直接写:

	select max(count(num))
	from nums
	group by num

会报错,原因见小tips的第二点

四、结语

我觉得我应该说清楚了where和having的区别了,也讲清楚了聚集函数为什么不能再where中使用🤔,按照执行顺序来写select语句,逻辑很清晰,不容易出错。

相关推荐

  1. MySQLDQL及执行顺序

    2024-04-06 17:54:03       57 阅读
  2. MySQL执行顺序

    2024-04-06 17:54:03       66 阅读
  3. MySQLSELECT语句执行流程详解

    2024-04-06 17:54:03       35 阅读
  4. MySQL 中 SQL 查询语句执行顺序

    2024-04-06 17:54:03       39 阅读
  5. SQL执行顺序

    2024-04-06 17:54:03       30 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-06 17:54:03       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-06 17:54:03       106 阅读
  3. 在Django里面运行非项目文件

    2024-04-06 17:54:03       87 阅读
  4. Python语言-面向对象

    2024-04-06 17:54:03       96 阅读

热门阅读

  1. 零日攻击测试

    2024-04-06 17:54:03       48 阅读
  2. 如何解决Docker镜像仓库认证失败的问题?

    2024-04-06 17:54:03       33 阅读
  3. NumPy 数组对象

    2024-04-06 17:54:03       40 阅读
  4. 星弟专享面试题汇总(星弟亲自总结)

    2024-04-06 17:54:03       40 阅读
  5. xss介绍及作用

    2024-04-06 17:54:03       41 阅读