文章目录

  • 一、聚合查询
  • 二、分组查询
  • 三、联合查询
    • 内连接
    • 外连接
    • 自连接
  • 四、合并查询
  • 五、子查询

一、聚合查询

聚合查询是针对行与行之间的计算,常见的聚合函数有:

函数作用
COUNT(expr)查询数据的数量
SUM(expr)查询数据的总和
AVG(expr)查询数据的平均值
MAX(expr)查询数据的最大值
MIN(expr)查询数据的最小值
create table stu(id int primary key,name varchar(50),math int,english int);insert into stu values(001,"张三",80,90),(002,"李四",75,80),(003,"王五",85,90),(004,"小王",90,80),(005,"小孙",null,null);

count函数:
顾名思义,count函数就是用来统计我们表的行数的。

但注意的是,我们再给count函数传参数时,这一列不能有null值。

我们发现当传入math参数时,因为math有一行的数据是null,count函数在统计时,自动省略这一行。

当然我们还可以传入全列,count传入全列时,只要这一列有不为null的值就会被统计上,但时间会相对增大,一般建议传入主键或者not null的列。
SUM函数:
用来计算某一列数值的综合,null自动省略。

也可以进行表达式进行聚合计算。

AVG函数:
avg函数对某一列求平均值,我们可以发现计算平均值是,null既不计入分子也不计入分母。

MAX函数:
求某一列的最大值

MIN函数:
求某一列的最小值

二、分组查询

有时候单纯使用聚合查询没啥意思,我们需要先分组在进行聚合计算。

create table stu(id int,name varchar(20),class varchar(20),math int,english int);insert into stu values(001,"张三","计算机1班",80,95),                      (002,"李四","计算机1班",90,76),                      (003,"王五","计算机2班",86,77),                      (004,"小王","计算机2班",92,86),                      (005,"张良","计算机2班",86,96);


我们来计算平均数学成绩

这样的平均成绩没啥意思,我们来求一下每个班的数学平均成绩

select class,avg(math) from stu group by class;


我们在来求一下,每班的数学最高分。

select name,class,max(math) from stu group by class;


分组查询,也可以指定条件
1.分组之前指定条件,先筛选在分组,WHERE
2.分组之后指定条件,先分组在筛选, HAVING
3.分组之前和分组之后都指定条件,WHERE HAVING都使用。

分组之前: 查询每个班的平均数学成绩,但是去掉小王的成绩

select class,avg(math) from stu where name != '小王' group by class;


分组之后: 查询每个班级的平均数学成绩,但去除平均成绩为85的班级。

select class,avg(math) from stu group by class having avg(math) != 85;


分组之前和分组之后都指定条件: 查询班级的平均成绩,去掉小王的成绩,并且去除计算机1班的平均数学成绩

select class,avg(math) from stu where name != '小王' group by class having class != '计算机1班';

三、联合查询

当我们多张表建立联系时,我们就可以进行联合查询,多表查询就是对多张表取笛卡尔积。

笛卡尔的结果列数是两张表列数之和,行数是两张表的行数之积.

create table classes (id int primary key auto_increment, name varchar(20), `desc` varchar(100));create table student (id int primary key auto_increment, sn varchar(20),  name varchar(20), qq_mail varchar(20) ,        classes_id int);create table course(id int primary key auto_increment, name varchar(20));create table score(score decimal(3, 1), student_id int, course_id int);
select * from student,classes

大家轻易可以发现,笛卡尔积里的结果很多都是无效的数据,因此我们需要将一部分无意义的数据给去掉。

我们通过这两个变量来建立关系,多表查询时,我们访问表中的变量时用表名点(.)变量表示。

 select * from student,classes where classes.id = student.classes_id;



当我们加上条件(这个条件我们成为连接条件)之后,剩下的都是“正确”的数据.
我们也可以指定列查询。

 select student.id,student.name,student.classes_id,classes.name from student,classes where classes.id = student.classes_id;

内连接

我们现在构造了四张表出来,student(学生表),classes(班级表),course(课程表),score(分数表).




我们查询一下白素贞的班级:
我们在进行联合查询的时候,不必急于求成,一步一步进行。

-- 1.先计算笛卡尔积select * from student,classes;

-- 2.引入连接条件select * from student,classes where classes.id = student.classes_id;

-- 3.引入名字为白素贞的条件select * from student,classes where classes.id = student.classes_id and student.name = '白素贞';

-- 4.只保留必要的列 select student.name,classes.name from student,classes where classes.id = student.classes_id and student.name = ' 白素贞';


联合查询也可以用join来完成:

 select student.name,classes.name from student join classes on classes.id = student.classes_id and student.name = '白素贞';


内连接还可以使用inner join完成。

 select student.name,classes.name from student inner join classes on classes.id = student.classes_id and student.name = '白素贞';


我们还可以进行多张表进行联合查询。

select * from student,score,course where student.id = score.student_id and course.id = score.course_id;


我们可以省略部分列,使用别名,join来查询

select student.name as 学生姓名,course.name as 课程名称,score.score as 分数 from student join score on student.id = score.student_id join course on score.course_id = course.id;

外连接

内连接和外连接在一些情况下,查询的结果没有差异(当两个表一一对应时),如果没有一一对应那么就有区别了。


我们可以用这两张表,建立一下内外连接看一下效果。

-- 内连接select * from student join score on student.id = score.student_id;

-- 外连接 select * from student left join score on student.id = score.student_id;


我们可以发现内外连接查询的结果是一样的。因为我们两个表的内容是一一对应的。

这时我们发现student表id为6的数据在score无对应



这时我们发现,内外查询的结果就有所差异了。
外连接:
当进行外连接时,如果是左连接,会把左表所有的数据查询到总结果中,如果右表没有对应数据,就是用NULL补充(右连接同理)。

自连接

SQL中无法对行和行之间使用条件比较,当我们要进行行行运算时,我们可以使用自连接进行调整。


我们想查询那个同学的java成绩比英文成绩高。

我们可以发现至今将表明写两遍,会报一个表名不唯一的错误。正确的做法是为表名起别名。

这里我们是自己和自己比,所以我们加上student_id相等的条件


然后对score1的科目进行限制为java,score2的科目限制为英文

select * from score as score1,score as score2 where score1.student_id = score2.student_id and score1.course_id = 1 and score2.course_id = 6;


我们发现只有两名学生即选择了java,又选择了英文。
我们再加上java比英文高的条件。

select * from score as score1,score as score2 where score1.student_id = score2.student_id and score1.course_id = 1 and score2.course_id = 6 and score1.score > score2.score;


我们发现没有java比英文高的数据

所以我们查出来的是空集合。

四、合并查询

在实际应用中,为了合并多个select的执行结果,可以使用集合操作符 union,union all。使用UNION和UNION ALL时,前后查询的结果集中,字段需要一致。

-- union select * from course where id < 4 union select * from course where name != 'java';

-- union all select * from course where id < 4 union all select * from course where name != 'java';


这里我们可以发现union可以去掉重复数据,而union all不去重。
大家需要注意or 与 union的区别,or的查询只能针对同一个表,而union可以来自于多张表,只要查询的结果能够对应列即可。

五、子查询

子查询最本质就是套娃,将多个SQL组合起来。
实际开发中,子查询的使用要小心(子查询会构造出来一些非常复杂并且不好理解的SQL,对于代码的可读性,执行效率都有可能造成很大的影响。
查询许仙的同班同学

正常思路,先去查询许仙的班级号,再去按照班级号去查那些同学和他一个班

select classes_id from student where name = '许仙';

select name from student where classes_id = 1 and name != '许仙';


子查询:

select name from student where classes_id = (select classes_id from student where name = '许仙') and name != '许 仙';


子查询返回一条记录,才可以写等号

查询java或者英文课的成绩信息
先查询java或者英文课的课程号,再根据课程号去查询课程分数

 select id from course where name = 'java' or name = '英文';

select * from score where course_id = 1 or course_id = 6;


子查询:

 select * from score where course_id in (select id from course where name = 'java' or name = '英文');



EXISTS关键字: 可读性比较差,效率也大大的比in低,适用于解决特殊情况

还是更推荐大家分步查询。