SQL(Structured Query Language)是用于管理关系数据库的标准编程语言。当我们编写一个SQL查询时,尽管查询语句的书写顺序与实际的执行顺序不同,但了解其执行顺序有助于更好地理解查询是如何工作的,以及如何优化查询。

以下是SQL查询的典型执行顺序:

FROM 和 JOIN: 首先,数据库会解析FROM和JOIN子句,确定要查询哪些表,并执行JOIN操作。例如,考虑以下查询:

sql`SELECT a.name, b.salary

FROM employees a

JOIN departments b ON a.dept_id = b.id;`

在这个查询中,首先会解析FROM和JOIN子句,确定要查询employees表和departments表,并根据dept_id和id进行连接。

WHERE:

接下来,数据库会查看WHERE子句,过滤出满足条件的记录。例如,如果有一个WHERE子句为WHERE age > 30,那么所有年龄小于或等于30的记录都会被排除。

GROUP BY:

如果存在GROUP BY子句,数据库会根据指定的列对结果进行分组。例如,对于以下查询:

sql`SELECT department, AVG(salary)

FROM employees

GROUP BY department;`

结果会按照部门进行分组,并计算每个部门的平均工资。

HAVING:

HAVING子句用于过滤经过GROUP BY分组后的结果。这与WHERE子句类似,但是是在分组后进行过滤。例如,考虑以下查询:

sql`SELECT department, AVG(salary)

FROM employees

GROUP BY department

HAVING AVG(salary) > 5000;`

这个查询会返回平均工资大于5000的部门。注意HAVING子句是在GROUP BY之后应用的。

SELECT:

接下来,数据库会选择要显示的列。如果查询中包含了聚合函数(如SUM、COUNT等),它们也会在这个阶段计算。例如,对于以下查询:

sql`SELECT department, COUNT(*) as num_employees, AVG(salary) as avg_salary

FROM employees;`

这个查询会选择部门、员工数量和平均工资。COUNT(*)函数会计算每个部门的员工数量,AVG(salary)函数会计算平均工资。

ORDER BY:

如果存在ORDER BY子句,数据库会对结果进行排序。默认是升序排序(ASC),如果需要降序排序,可以使用DESC关键字。例如:

sql`SELECT name, salary

FROM employees

ORDER BY salary DESC;`

这个查询会按照薪水从高到低对员工进行排序。

LIMIT 和 OFFSET(或FETCH FIRST / OFF):

最后,如果存在LIMIT、OFFSET或FETCH FIRST / OFF子句,数据库会限制返回的记录数。例如:

sql`SELECT name, salary

FROM employees

LIMIT 10;`

这个查询只会返回前10条记录。或者:

sql`SELECT name, salary

FROM employees

OFFSET 10;`

这个查询会跳过前10条记录,然后返回剩余的记录。或者使用FETCH FIRST / OFF:

sql`SELECT name, salary

FROM employees

FETCH FIRST 10 ROWS ONLY;`

下面通过图文结合的方式再进行简要讲解: 这是我们实际上SQL执行顺序: 我们先执行from,join来确定表之间的连接关系,得到初步的数据 where对数据进行普通的初步的筛选 group by 分组 各组分别执行having中的普通筛选或者聚合函数筛选。 然后把再根据我们要的数据进行select,可以是普通字段查询也可以是获取聚合函数的查询结果,如果是集合函数,select的查询结果会新增一条字段 将查询结果去重distinct 最后合并各组的查询结果,按照order by的条件进行排序 数据的关联过程 数据库中的两张表 from&join&where 用于确定我们要查询的表的范围,涉及哪些表。 选择一张表,然后用join连接 from table1 join table2 on table1.id=table2.id 选择多张表,用where做关联条件 from table1,table2 where table1.id=table2.id 我们会得到满足关联条件的两张表的数据,不加关联条件会出现笛卡尔积。 group by 按照我们的分组条件,将数据进行分组,但是不会筛选数据。 比如我们按照即id的奇偶分组 having&where having中可以是普通条件的筛选,也能是聚合函数。而where只能是普通函数,一般情况下,有having可以不写where,把where的筛选放在having里,SQL语句看上去更丝滑。 使用where再group by 先把不满足where条件的数据删除,再去分组 使用group by再having 先分组再删除不满足having条件的数据,这两种方法有区别吗,几乎没有! 举个例子: 100/2=50,此时我们把100拆分(10+10+10+10+10…)/2=5+5+5+…+5=50,只要筛选条件没变,即便是分组了也得满足筛选条件,所以where后group by 和group by再having是不影响结果的! 不同的是,having语法支持聚合函数,其实having的意思就是针对每组的条件进行筛选。我们之前看到了普通的筛选条件是不影响的,但是having还支持聚合函数,这是where无法实现的。 当前数据分组情况 执行having的筛选条件,可以使用聚合函数。筛选掉工资小于各组平均工资的having salary select 分组结束之后,我们再执行select语句,因为聚合函数是依赖于分组的,聚合函数会单独新增一个查询出来的字段,这里用紫色表示,这里我们两个id重复了,我们就保留一个id,重复字段名需要指向来自哪张表,否则会出现唯一性问题。最后按照用户名去重。 select employee.id,distinct name,salary, avg(salary) 将各组having之后的数据再合并数据。 order by 最后我们执行order by 将数据按照一定顺序排序,比如这里按照id排序。如果此时有limit那么查询到相应的我们需要的记录数时,就不继续往下查了。 limit 记住limit是最后查询的,为什么呢?假如我们要查询年级最小的三个数据,如果在排序之前就截取到3个数据。实际上查询出来的不是最小的三个数据而是前三个数据了,记住这一点。 我们如果limit 0,3窃取前三个数据再排序,实际上最少工资的是2000,3000,4000。你这里只能是4000,5000,8000了。

好文链接

评论可见,请评论后查看内容,谢谢!!!
 您阅读本篇文章共花了: