一条 SQL 查询语句结构如下:
SELECT DISTINCT FROM JOIN ON WHERE GROUP BY HAVING ORDER BY LIMIT
但真正的执行步骤如下,执行时,每个步骤都会产生一个虚拟表,该虚拟表被用作下一个步骤的输入:
1. FROM
在这一步,无论后面跟那种联接运算(LEFT JOIN、RIGHT JOIN等),都首先执行交叉联接(CROSS JOIN),计算笛卡尔积,生成虚拟表 VT-1
2. ON
根据 ON 的筛选条件对 VT-1 进行筛选,生成 VT-2
3. JOIN
如果指定了OUTER JOIN(如 LEFT JOIN、RIGHT JOIN),将上一步没有匹配的行添加到 VT-2,生成 VT-3。例如 LEFT JOIN 会将左表的剩余数据添加到 VT-2 中
如果 FROM 子句包含两个以上表,则这一步最后生成的虚表 VT-3 和 FROM 子句的下一个表重复依次执行前述三个步骤,直到处理完所有的表为止
4. WHERE
根据条件对 VT-3 进行筛选,条件成立的行插入 VT-4
5. GROUP BY
按照指定的列名对 VT-4 的行进行分组,生成VT-5,最后每个分组只有一行
6. HAVING
使用聚合函数对 VT-5 的分组进行筛选,生成 VT-6
7. SELECT
投影获取指定的列,如有表达式则计算,生成 VT-7
8. DISTINCT
数据除重,生成 VT-8
9. ORDER BY
根据 ORDER BY 子句中指定的列排序,生成 VT-9
10. LIMIT
取出指定行的记录,产生 VT-10,并返回给查询用户