关联查询,也称为多表查询,指两个或更多个表一起完成查询操作。 前提条件:这些一起查询的表之间是有关系的(一对一、一对多),它们之间一定是有关联字段,这个关联字段可能建立了外键,也可能没有建立外键。
一、错误案例引入问题
1.案例说明
先来看几个简单的表,如下:
emp表:职工表,关联dept表
dept表:部门表,关联location表
location表:部门地区表
此时我们需要查询到员工的姓名及其部门名称:
如果我们错误的使用到下面的语句的话:
SELECT *from emp,dept
得到结果如下:一共20条数据,它是对应emp的4条记录×dept的5条记录
我们把上述多表查询中出现的问题称为:笛卡尔积的错误。
2.笛卡尔积(或交叉连接)的理解
笛卡尔乘积是一个数学运算。假设我有两个集合 X 和 Y,那么 X 和 Y 的笛卡尔积就是 X 和 Y 的所有可能的组合,也就是第一个对象来自于 X,第二个对象来自于 Y 的所有可能。组合的个数即为两个集合中元素个数的乘积数。
SQL92中,笛卡尔积也称为交叉连接 ,英文是 CROSS JOIN 。在 SQL99 中也是使用 CROSS JOIN表示交叉连接。它的作用就是可以把任意表进行连接,即使这两张表不相关。
在MySQL中如下情况会出现笛卡尔积:
select * from emp,deptselect * from emp cross join deptselect * from emp inner join deptselect * from emp join dept
inner join为内连接,等于join(省略了inner),内连接后面可以不接on
在上面的例子中笛卡尔积的不适应主要在于:emp表和dept表没有指明关联关系,导致表中的所有行互相连接。
为了避免笛卡尔积错误,可以在where加上有效的连接条件,如下:
select *from emp,deptwhere emp.dept_id = dept.id
结果如下:
可以和前面的笛卡尔积错误的结果进行比较,该sql语句表示从笛卡尔积的结果中筛选出想要的数据(员工的部门id等于部门id)。
因为如此,陈七的部门id为null,在笛卡尔积中找不出陈七的部门id和哪个部门对应,所有没有出现在结果集中,这是内连接的一个特性。
也可以n张表进行连接,如在上面的例子进行扩充,求出每个员工的工作地点,需要连接三张表,只需用and连接上条件即可。
select *from emp,dept,locationwhere emp.dept_id = dept.id and dept.location_id = location.id
二、多表查询的分类
关联查询可分为如下几类:
- 等值连接和非等值连接
- 自连接和非自连接
- 内连接和外连接
我们需要根据需求去选择不同种类的连接查询
1.等值连接和非等值连接
等值连接就是前面的案例中,员工表的部门id与部门表的id呈现一个相等的状态,侧重于相等,所以叫等值连接。而非等值连接不是相等的情况。
来看一个非等值连接的情况:
如下两张表,需要求每个学生的成绩对应的等级
代码如下:
select name,grade,levelfrom student,scorewhere student.grade between score.lowest_grade and score.greatest_grede
该关联查询没有使用的关联条件不是=,而是其他的条件,被称为非等值连接。
2.自连接和非自连接
前面的员工表关联部门表进行查询就是非自连接,连接的其它表;而自连接就是连接当前表。
例子:上面的emp表有一个manager_id的字段,表示它的管理者id,同样的管理者同样也是员工,也是记录也在emp表中的,所以为了求出每个员工的管理者,就需要自连接:
select concat(e1.name,'为',e2.name,'工作')from emp e1,emp e2where e1.manager_id = e2.id
结果:
自连接:当table1和table2本质上是同一张表,只是用取别名的方式虚拟成两张表以代表不同的意义。然后两个表再进行内连接,外连接等查询。
3.内连接和外连接
- 内连接: 合并具有同一列的两个以上的表的行, 结果集中不包含一个表与另一个表不匹配的行。
- 外连接: 两个表在连接过程中除了返回满足连接条件的行以外还返回左(或右)表中不满足条件的行 ,这种连接称为左(或右)外连接。没有匹配的行时,结果表中相应的列为空(NULL)。
如果是左外连接,则连接条件中左边的表也称为主表 ,右边的表称为从表 。 如果是右外连接,则连接条件中右边的表也称为主表 ,左边的表称为从表 。
初步认识
在前面的例子中,我们使用到的是内连接:
#查询到所有员工的部门名,内连接的写法之一SELECT emp.name,dept.namefrom emp,deptwhere emp.dept_id=dept.id
结果如下:
但是你会发现,少了个员工,这是因为该员工的部门id为空,在部门表中并没有相应的数据,又因为是内连接,所有该员工不会出现在结果里。
要想解决该问题,就需要使用外连接。使员工表为主表,左外连接部门表:
得到的结果为:
如果使用右外连接,结果为:
也就是说部门表中所有的记录都会匹配出,尽管有些部门没有任何的员工,也列出来。
这是左外连接和右外连接的一个区别。
三、实现多表查询的语法
使用JOIN…ON子句创建连接的语法结构:
SELECT table1.column, table2.column,table3.columnFROM table1JOIN table2 ON table1 和 table2 的连接条件JOIN table3 ON table2 和 table3 的连接条件
语法说明:
- 可以使用 ON 子句指定额外的连接条件。
- 这个连接条件是与其它条件分开的。
- ON 子句使语句具有更高的易读性。
- 关键字 JOIN、INNER JOIN、CROSS JOIN 的含义是一样的,都表示内连接。
1.内连接(INNER JOIN)的实现
语法:
SELECT 字段列表FROM A表 INNER JOIN B表ON 关联条件WHERE 等其他子句;
例子:使用新的语法替换之前的查询员工操作,要求没有部门的员工不显示出来:
SELECT emp.name,dept.namefrom empinner join depton emp.dept_id = dept.id
2.外连接(OUTER JOIN)的实现
2.1左外连接
语法:
#实现查询结果是ASELECT 字段列表FROM A表 LEFT OUTER JOIN B表ON 关联条件WHERE 等其他子句;
OUTER关键字可省略。
例子:查询所有员工的工作地点,没有部门的员工照样显示出来。
SELECT emp.name,dept.name,location.regionfrom emp left outer join depton emp.dept_id = dept.idleft join locationon dept.location_id = location.id
2.2右外连接(RIGHT OUTER JOIN)
语法:
SELECT 字段列表FROM A表 RIGHT JOIN B表ON 关联条件WHERE 等其他子句;
例子:查询员工的部门信息,没有部门的员工不显示,但是把没有员工对应的部门也显示出来。
SELECT emp.name,dept.namefrom emp right join depton emp.dept_id = dept.id
结果:
3.满外连接(FULL OUTER JOIN)
还有一种外连接结合了左外连接和右外连接的特点,称为满外连接:
- 满外连接的结果 = 左右表匹配的数据 + 左表没有匹配到的数据 + 右表没有匹配到的数据。
- SQL99是支持满外连接的。使用FULL JOIN 或 FULL OUTER JOIN来实现。
- 需要注意的是,MySQL不支持FULL JOIN,但是可以用 LEFT JOIN UNION RIGHT JOIN代替。
四、UNION的使用
合并查询结果
利用UNION关键字,可以给出多条SELECT语句,并将它们的结果组合成单个结果集。合并时,两个表对应的列数和数据类型必须相同,并且相互对应。各个SELECT语句之间使用UNION或UNION ALL关键字分隔。
语法格式:
SELECT column,... FROM table1UNION [ALL]SELECT column,... FROM table2
- UNION 操作符返回两个查询的结果集的并集,去除重复记录。
- UNION ALL操作符返回两个查询的结果集的并集。对于两个结果集的重复部分,不去重。
注意:执行UNION ALL语句时所需要的资源比UNION语句少。如果明确知道合并数据后的结果数据不存在重复数据,或者不需要去除重复的数据,则尽量使用UNION ALL语句,以提高数据查询的效率。
举例1:查询部门编号>90或邮箱包含a的员工信息
#方式1SELECT * FROM employees WHERE email LIKE '%a%' OR department_id>90
#方式2SELECT * FROM employees WHERE email LIKE '%a%'UNIONSELECT * FROM employees WHERE department_id>90;
举例2:使用union实现满外连接(下面内容会使用union all加速查找)
SELECT emp.name,dept.namefrom emp left join depton emp.dept_id = dept.idunionselect emp.name,dept.namefrom emp right join depton emp.dept_id = dept.id
结果:
五、7种SQL JOINS的实现
下图是两种表的连接查询图,它们插叙的结果各不相同。图中红色部分代表最后查询的结果。
1.代码实现
- 中图:内连接 A∩B,只取公共部分
select emp.name,dept.namefrom emp inner join depton dept_id = dept.id
- 左上图:左外连接,取左表的所有记录,并有条件的连接右表记录
select emp.name,dept.namefrom emp left join depton dept_id = dept.id
- 右上图:右外连接,取右表的所有记录,并有条件的连接左表记录
select emp.name,dept.namefrom emp right join depton dept_id = dept.id
- 左中图:A -A ∩ B
select emp.name,dept.namefrom emp left join depton dept_id = dept.idwhere dept.id is null #去掉A∩B的部分
- 右中图:B -A ∩ B
select emp.name,dept.namefrom emp right join depton dept_id = dept.idwhere emp.id is null #或者dept_id is null
- 左下图:是一个全连接,mysql不直接支持,但我们可以使用上面的union实现,但是根据上面的图,我们可以直接使用union all实现,增加效率。
具体的:使用左上图 union all 右中图,或者右上图 union all 左中图都行。
select emp.name,dept.name #左外连接取 A+(A∩B)from emp left join depton emp.dept_id = dept.idunion all#没有去重操作,效率高select emp.name,dept.name #右外连接取 B-(A∩B)from emp right join depton emp.dept_id = dept.idwhere emp.id is null
- 右下图:A ∪B- A ∩ B
使用左中图和右中图结合起来即可
select emp.name,dept.name from emp left join depton emp.dept_id = dept.idwhere dept.id is nullunion allselect emp.name,dept.namefrom emp right join depton emp.dept_id = dept.idwhere emp.id is null
六、SQL99语法新特性
1.自然连接
SQL99 在 SQL92 的基础上提供了一些特殊语法,比如 NATURAL JOIN 用来表示自然连接。我们可以把自然连接理解为SQL92中的等值连接。它会帮你自动查询两张连接表中所有相同的字段,然后进行等值连接 。
在SQL92标准中:
SELECT employee_id,last_name,department_nameFROM employees e JOIN departments dON e.`department_id` = d.`department_id`AND e.`manager_id` = d.`manager_id`;
在 SQL99 中你可以写成:
SELECT employee_id,last_name,department_nameFROM employees e NATURAL JOIN departments d;
前提是字段名相同。
2.USING连接
当我们进行连接的时候,SQL99还支持使用 USING 指定数据表里的同名字段 进行等值连接。但是只能配合JOIN一起使用。比如:
SELECT employee_id,last_name,department_nameFROM employees e JOIN departments dUSING (department_id);
你能看出与自然连接 NATURAL JOIN 不同的是,USING 指定了具体的相同的字段名称,你需要在 USING 的括号 () 中填入要指定的同名字段。同时使用 JOIN…USING 可以简化 JOIN ON 的等值连接。它与下 面的 SQL 查询结果是相同的:
SELECT employee_id,last_name,department_nameFROM employees e ,departments dWHERE e.department_id = d.department_id;
表连接的约束条件可以有三种方式:WHERE, ON, USING
- WHERE:适用于所有关联查询
- ON :只能和JOIN一起使用,只能写关联条件。虽然关联条件可以并到WHERE中和其他条件一起 写,但分开写可读性更好。
- USING:只能和JOIN一起使用,而且要求两个关联字段在关联表中名称一致,而且只能表示关联字 段值相等
我们要控制连接表的数量 。多表连接就相当于嵌套 for 循环一样,非常消耗资源,会让 SQL 查询性能下降得很严重,因此不要连接不必要的表。在许多 DBMS 中,也都会有最大连接表的限制。