多表联合查询
在 MySQL 中,多表查询主要有交叉连接、内连接、外连接、分组查询与子查询等5种。
一、交叉连接
交叉连接的语法格式如下:
SELECT <字段名> FROM <表1> CROSS JOIN <表2> [WHERE子句];
或
SELECT <字段名> FROM <表1>, <表2> [WHERE子句];
语法说明如下:
- 字段名:需要查询的字段名称。
- <表1><表2>:需要交叉连接的表名。
- WHERE 子句:用来设置交叉连接的查询条件。
mysql> select * from house;
+------+-------------+
| id | room_number |
+------+-------------+
| 1 | 101 |
| 2 | 201 |
| 3 | 301 |
| 4 | 401 |
| 5 | 501 |
+------+-------------+
5 rows in set (0.00 sec)
mysql> select * from student;
+----+------------+------+----------+------+--------+
| id | name | age | province | sex | height |
+----+------------+------+----------+------+--------+
| 1 | zhangsan | 20 | hubei | m | 180 |
| 2 | limei | 20 | hubei | f | 165 |
| 3 | wangermazi | 19 | hunan | m | 175 |
| 4 | natasha | 18 | shanxi | f | 160 |
+----+------------+------+----------+------+--------+
4 rows in set (0.00 sec)
使用 CROSS JOIN 查询出两张表中的笛卡尔积,SQL 语句和运行结果如下:
mysql> SELECT * FROM house cross join student;
+------+-------------+----+------------+------+----------+------+--------+
| id | room_number | id | name | age | province | sex | height |
+------+-------------+----+------------+------+----------+------+--------+
| 1 | 101 | 1 | zhangsan | 20 | hubei | m | 180 |
| 1 | 101 | 2 | limei | 20 | hubei | f | 165 |
| 1 | 101 | 3 | wangermazi | 19 | hunan | m | 175 |
| 1 | 101 | 4 | natasha | 18 | shanxi | f | 160 |
| 2 | 201 | 1 | zhangsan | 20 | hubei | m | 180 |
| 2 | 201 | 2 | limei | 20 | hubei | f | 165 |
| 2 | 201 | 3 | wangermazi | 19 | hunan | m | 175 |
| 2 | 201 | 4 | natasha | 18 | shanxi | f | 160 |
| 3 | 301 | 1 | zhangsan | 20 | hubei | m | 180 |
| 3 | 301 | 2 | limei | 20 | hubei | f | 165 |
| 3 | 301 | 3 | wangermazi | 19 | hunan | m | 175 |
| 3 | 301 | 4 | natasha | 18 | shanxi | f | 160 |
| 4 | 401 | 1 | zhangsan | 20 | hubei | m | 180 |
| 4 | 401 | 2 | limei | 20 | hubei | f | 165 |
| 4 | 401 | 3 | wangermazi | 19 | hunan | m | 175 |
| 4 | 401 | 4 | natasha | 18 | shanxi | f | 160 |
| 5 | 501 | 1 | zhangsan | 20 | hubei | m | 180 |
| 5 | 501 | 2 | limei | 20 | hubei | f | 165 |
| 5 | 501 | 3 | wangermazi | 19 | hunan | m | 175 |
| 5 | 501 | 4 | natasha | 18 | shanxi | f | 160 |
+------+-------------+----+------------+------+----------+------+--------+
20 rows in set (0.01 sec)
查询 house表中的 id 字段和 student 表中的 id 字段相等的内容, SQL 语句和运行结果如下:
mysql> SELECT * FROM house cross join student where house.id = student.id;
+------+-------------+----+------------+------+----------+------+--------+
| id | room_number | id | name | age | province | sex | height |
+------+-------------+----+------------+------+----------+------+--------+
| 1 | 101 | 1 | zhangsan | 20 | hubei | m | 180 |
| 2 | 201 | 2 | limei | 20 | hubei | f | 165 |
| 3 | 301 | 3 | wangermazi | 19 | hunan | m | 175 |
| 4 | 401 | 4 | natasha | 18 | shanxi | f | 160 |
+------+-------------+----+------------+------+----------+------+--------+
4 rows in set (0.00 sec)
二、内连接
内连接(INNER JOIN)主要通过设置连接条件的方式,来移除查询结果中某些数据行的交叉连接。简单来说,就是利用条件表达式来消除交叉连接的某些数据行。
内连接使用 INNER JOIN 关键字连接两张表,并使用 ON 子句来设置连接条件。如果没有连接条件,INNER JOIN 和 CROSS JOIN 在语法上是等同的,两者可以互换。
内连接的语法格式如下:
SELECT <字段名> FROM <表1> INNER JOIN <表2> [ON子句];
语法说明如下。
- 字段名:需要查询的字段名称。
- <表1><表2>:需要内连接的表名。
- INNER JOIN :内连接中可以省略 INNER 关键字,只用关键字 JOIN。
- ON 子句:用来设置内连接的连接条件。
查询 house表中的 ip 字段和 student 表中的学生名字和宿舍号的信息SQL,语句和运行结果如下:
mysql> select student.name,house.room_number from student RIGHT OUTER JOIN house on student.id=house.id;
+------------+-------------+
| name | room_number |
+------------+-------------+
| zhangsan | 101 |
| limei | 201 |
| wangermazi | 301 |
| natasha | 401 |
| NULL | 501 |
+------------+-------------+
5 rows in set (0.00 sec)
三、外连接
内连接的查询结果都是符合连接条件的记录,而外连接会先将连接的表分为基表和参考表,再以基表为依据返回满足和不满足条件的记录。外连接可以分为左外连接和右外连接2种。
1.左连接
左外连接又称为左连接,使用 LEFT OUTER JOIN 关键字连接两个表,并使用 ON 子句来设置连接条件。
左连接的语法格式如下:
SELECT <字段名> FROM <表1> LEFT OUTER JOIN <表2> <ON子句>;
语法说明如下:
- 字段名:需要查询的字段名称。
- <表1><表2>:需要左连接的表名。
- LEFT OUTER JOIN:左连接中可以省略 OUTER 关键字,只使用关键字 LEFT JOIN。
- ON 子句:用来设置左连接的连接条件,不能省略。
上述语法中,"表1"为基表,"表2"为参考表。左连接查询时,可以查询出"表1"中的所有记录和"表2"中匹配连接条件的记录。如果"表1"的某行在"表2"中没有匹配行,那么在返回结果中,"表2"的字段值均为空值(NULL)。
mysql> select student.name,house.room_number from house LEFT OUTER JOIN student on student.id=house.id;
+------------+-------------+
| name | room_number |
+------------+-------------+
| zhangsan | 101 |
| limei | 201 |
| wangermazi | 301 |
| natasha | 401 |
| NULL | 501 |
+------------+-------------+
5 rows in set (0.00 sec)
2.右连接
右外连接又称为右连接,右连接是左连接的反向连接。使用 RIGHT OUTER JOIN 关键字连接两个表,并使用 ON 子句来设置连接条件。
右连接的语法格式如下:
SELECT <字段名> FROM <表1> RIGHT OUTER JOIN <表2> <ON子句>;
语法说明如下:
- 字段名:需要查询的字段名称。
- <表1><表2>:需要右连接的表名。
- RIGHT OUTER JOIN:右连接中可以省略 OUTER 关键字,只使用关键字 RIGHT JOIN。
- ON 子句:用来设置右连接的连接条件,不能省略。
与左连接相反,右连接以"表2"为基表,"表1"为参考表。右连接查询时,可以查询出"表2"中的所有记录和"表1"中匹配连接条件的记录。如果"表2"的某行在"表1"中没有匹配行,那么在返回结果中,"表1"的字段值均为空值(NULL)。
mysql> select student.name,house.room_number from student RIGHT OUTER JOIN house on student.id=house.id;
+------------+-------------+
| name | room_number |
+------------+-------------+
| zhangsan | 101 |
| limei | 201 |
| wangermazi | 301 |
| natasha | 401 |
| NULL | 501 |
+------------+-------------+
5 rows in set (0.00 sec)
四、分组查询
在 MySQL 中,GROUP BY 关键字可以根据一个或多个字段对查询结果进行分组。
使用 GROUP BY 关键字的语法格式如下:
GROUP BY <字段名>
其中,"字段名"表示需要分组的字段名称,多个字段时用逗号隔开。
GROUP BY单独使用
单独使用 GROUP BY 关键字时,查询结果会只显示每个分组的第一条记录。
下面根据 students表中的 sex 字段进行分组查询,SQL 语句和运行结果如下:
mysql> SELECT `name`,`sex` FROM student GROUP BY name,sex;
+------------+------+
| name | sex |
+------------+------+
| limei | f |
| natasha | f |
| wangermazi | m |
| zhangsan | m |
+------------+------+
4 rows in set (0.00 sec)
结果中只显示了4条记录,这4条记录的 sex 字段的值分别为“f“"f”“m“"m”。
GROUP BY 与 GROUP_CONCAT()
GROUP BY 关键字可以和 GROUP_CONCAT() 函数一起使用。GROUP_CONCAT() 函数会把每个分组的字段值都显示出来。
下面根据 students表中的 sex 字段进行分组查询,使用 GROUP_CONCAT() 函数将每个分组的 name 字段的值都显示出来。SQL 语句和运行结果如下:
mysql> SELECT `sex`, GROUP_CONCAT(name) FROM student GROUP BY sex;
+------+---------------------+
| sex | GROUP_CONCAT(name) |
+------+---------------------+
| f | limei,natasha |
| m | zhangsan,wangermazi |
+------+---------------------+
2 rows in set (0.00 sec)
由结果可以看到,查询结果分为两组,sex 字段值为"女"的是一组,值为"男"的是一组,且每组的学生姓名都显示出来了。
GROUP BY 与聚合函数
在数据统计时,GROUP BY 关键字经常和聚合函数一起使用。
聚合函数包括 COUNT(),SUM(),AVG(),MAX() 和 MIN()。其中,COUNT() 用来统计记录的条数;SUM() 用来计算字段值的总和;AVG() 用来计算字段值的平均值;MAX() 用来查询字段的最大值;MIN() 用来查询字段的最小值。
下面根据students表的 sex 字段进行分组查询,使用 COUNT() 函数计算每一组的记录数。SQL 语句和运行结果如下:
mysql> SELECT sex,COUNT(sex) FROM student GROUP BY sex;
+------+------------+
| sex | COUNT(sex) |
+------+------------+
| f | 2 |
| m | 2 |
+------+------------+
2 rows in set (0.00 sec)
结果显示,sex 字段值为"女"的记录是一组,有 5 条记录;sex 字段值为"男"的记录是一组,有 5 条记录。
GROUP BY 与 WITH ROLLUP
WITH POLLUP 关键字用来在所有记录的最后加上一条记录,这条记录是上面所有记录的总和,即统计记录数量。
下面根据 students表中的 sex 字段进行分组查询,并使用 WITH ROLLUP 显示记录的总和:
mysql> SELECT sex,GROUP_CONCAT(name) FROM student GROUP BY sex WITH ROLLUP;
+------+-----------------------------------+
| sex | GROUP_CONCAT(name) |
+------+-----------------------------------+
| f | limei,natasha |
| m | zhangsan,wangermazi |
| NULL | limei,natasha,zhangsan,wangermazi |
+------+-----------------------------------+
3 rows in set (0.00 sec)
查询结果显示,GROUP_CONCAT(name) 显示了每个分组的 name 字段值。同时,最后一条记录的 GROUP_CONCAT(name) 字段的值刚好是上面分组 name 字段值的总和。
五、子查询
子查询是 MySQL 中比较常用的查询方法,通过子查询可以实现多表查询。子查询指将一个查询语句嵌套在另一个查询语句中。子查询可以在 SELECT、UPDATE 和 DELETE 语句中使用,而且可以进行多层嵌套。在实际开发时,子查询经常出现在 WHERE 子句中。
子查询在 WHERE 中的语法格式如下:
WHERE <表达式> <操作符> (子查询)
其中,操作符可以是比较运算符和 IN、NOT IN、EXISTS、NOT EXISTS 等关键字。
1)IN | NOT IN
当表达式与子查询返回的结果集中的某个值相等时,返回 TRUE,否则返回 FALSE;若使用关键字 NOT,则返回值正好相反。
2)EXISTS | NOT EXISTS
用于判断子查询的结果集是否为空,若子查询的结果集不为空,返回 TRUE,否则返回 FALSE;若使用关键字 NOT,则返回的值正好相反。
例 1
使用子查询在student表和house表中查询住在101房间学生姓名,SQL 语句和运行结果如下:
mysql> SELECT name FROM student WHERE id IN (SELECT id FROM house WHERE house.room_number= '101');
+----------+
| name |
+----------+
| zhangsan |
+----------+
1 row in set (0.00 sec)
结果显示,住在101房间学生只有张三。上述查询过程也可以分为以下 2 步执行,实现效果是相同的。
首先单独执行内查询,查询出 house 表中房间号为101的 id,SQL 语句和运行结果如下:
mysql> SELECT id FROM house WHERE house.room_number = '101';
+------+
| id |
+------+
| 1 |
+------+
1 row in set (0.00 sec)
可以看到,符合条件的 id 字段的值为 1。
然后执行外层查询,在 house 表中查询 student等于 1 的学生姓名。SQL 语句和运行结果如下:
mysql> SELECT name FROM student WHERE id IN (1);
+----------+
| name |
+----------+
| zhangsan |
+----------+
1 row in set (0.00 sec)
习惯上,外层的 SELECT 查询称为父查询,圆括号中嵌入的查询称为子查询(子查询必须放在圆括号内)。MySQL 在处理上例的 SELECT 语句时,执行流程为:先执行子查询,再执行父查询。
例 2
与例 1 类似,在 SELECT 语句中使用 NOT IN 关键字,查询出不在101房间的同学姓名,SQL 语句和运行结果如下:
mysql> SELECT name FROM student WHERE id NOT IN (SELECT id FROM house WHERE house.room_number=
'101');
+------------+
| name |
+------------+
| limei |
| wangermazi |
| natasha |
+------------+
3 rows in set (0.00 sec)
可以看出,运行结果与上面的例子刚好相反,不在101房间的同学是除了zhangsan之外的学生。