Bootstrap

【MySQL — 数据库增删改查操作】深入解析MySQL的 Retrieve 检索操作

  


Retrieve 检索


示例 


1. 构造数据


   创建表结构   

create table exam1(
    id bigint, 
    name varchar(20) comment'同学姓名', 
    Chinesedecimal(3,1) comment '语文成绩', 
    Math decimal(3,1) comment '数学成绩', 
    English decimal(3,1) comment '英语成绩'
);

   插入测试数据   

 insert into exam1(id,name,Chinese,math,English) values
(1,'唐三藏',67,98,56),
(2,'孙悟空',87,78,77),
(3,'猪悟能',88,98,90),
(4,'曹孟德',82,84,67),
(5,'刘玄德',55,85,45),
(6,'孙权'  ,70,73,78),
(7,'宋公明',75,65,30);

2. Select


2.1 全列查询


select*from exam1;
+------+-----------+---------+------+---------+
| id   | name      | Chinese | Math | English |
+------+-----------+---------+------+---------+
|    1 | 唐三藏    |      67 |   98 |      56 |
|    2 | 孙悟空    |      87 |   78 |      77 |
|    3 | 猪悟能    |      88 |   98 |      90 |
|    4 | 曹孟德    |      82 |   84 |      67 |
|    5 | 刘玄德    |      55 |   85 |      45 |
|    6 | 孙权      |      70 |   73 |      78 |
|    7 | 宋公明    |      75 |   65 |      30 |
+------+-----------+---------+------+---------+

   select *是一个很危险的操作: 

  • 只要涉及到硬盘操作和网络操作,就会消耗一定的硬盘带宽和网络带宽;
  • 意味着硬盘和网卡的读写速度都是存在上限的,一旦触发大规模的 select * 意味着很可能就把 硬盘/网卡带宽给吃满了(堵车);
  • 其他的客户端尝试访问数据库,访问操作就无法正常进行了;
  • 如果针对公司的生产环境进行select*,就很可能使其他的用户访问数据库的时候,出现访问失败的情况;
  • 当前阶段,数据库中,没啥数据,select*就无所谓了;以后再工作中,尤其是"生产环境",一定要慎重!!


2.2 指定列查询

    语法    

select 列名, 列名...... from 表名;


select id , name , Chinese from exam1;  # 查询指定列


select English, math, Chinese, name, id from exam1;  # 按照指定的顺序查询

mysql 是一个客户端-服务器结构的程序,如果使用 select* 会消耗大量的硬盘带宽和网络带宽,这些带宽往往是比较稀缺的资源;因此,使用指定列查询,得到的数据量就比全列查询要少很多,查询要查询的列即可,没有必要一次性查询所有列;


2.3 查询字段为表达式

   把所有学生的语文成绩加10分  

select name, Chinese + 10 from exam1;

执行 select 就会遍历每一行,取出需要的列,把列代入到表达式中; 

这样的结果,只是数据库查询过程中生成的临时表,数据库本体(数据库服务器硬盘上的数据)是没有任何改变的。


desc exam1;
+---------+--------------+------+-----+---------+-------+
| Field   | Type         | Null | Key | Default | Extra |
+---------+--------------+------+-----+---------+-------+
| id      | bigint       | YES  |     | NULL    |       |
| name    | varchar(20)  | YES  |     | NULL    |       |
| Chinese | decimal(3,1) | YES  |     | NULL    |       |
| Math    | decimal(3,1) | YES  |     | NULL    |       |
| English | decimal(3,1) | YES  |     | NULL    |       |
+---------+--------------+------+-----+---------+-------+
5 rows in set (0.01 sec)

根据上述表结构我们可以发现, 如果Chinese +20,就意味着有些成绩的结果就会超出decimal(3,1) 类型约定的范围.


   我们尝试一下查询 Chinese +20 操作,看看数据库查询超出类型范围会如何处理: 

select name, Chinese + 20 from exam1;
+-----------+------------+
| name      | Chinese+20 |
+-----------+------------+
| 唐三藏    |       87.0 |
| 孙悟空    |      107.0 |
| 猪悟能    |      108.0 |
| 曹孟德    |      102.0 |
| 刘玄德    |       75.0 |
| 孙权      |       90.0 |
| 宋公明    |       95.0 |
+-----------+------------+
7 rows in set (0.00 sec)

可以看到,虽然这个结果已经超出了 decimal(3,1) 的范围,但是依旧是可以查询,并且查询结果是正确的;所以我们需要明确:

  • decimal(3,1) 这样的表的类型,是针对硬盘上存储的数据进行制约的;
  • 但是我们当前的查询操作,得到的表中的计算结果,是临时的表数据,不会影响硬盘上的数据;,就可以不受 decimal(3,1) 这样的类型的约束;
  • 换句话说,临时表的数据会尽可能保证查询结果是完整正确的,优先级高于类型约束;

   在一个表达式中,还可以引入多个列参与运算   


-- 总成绩查询

select name , Chinese + math + English from exam1;

注意:表达式查询只能针对列和列之间进行运算,行和行之间的运算,后面会介绍聚合查询 ;


2.4 为查询结果指定别名

   为总分这一列指定别名   


如果表达式简单,一眼就能看明白;但是如果表达式比较复杂,就没法直观观察了;此处就可以给表达式取别名(别名只是针对临时表的列名产生修改),此时别名就是查询结果的列名:

select 表达式 as 别名from 表名;

select name , Chinese + math + English as total from exam1;


select name , Chinese + math + English total from exam1;

2.5 结果去重查询 

    语法    

select distinct 列名 from 表名;

去重的意思,多个行的数据,如果出现相同的值,就会只保留一份 


    查询当前的数学成绩,并去除重复记录     


-- 去重查询

mysql> select distinct math from exam1;

 去重查询对原来表中的数据无影响,再次查询得到的结果,依旧包含被上一次去重的数据;


3 Where 条件查询


   语法   

select 列名 from 表名 where 条件;

查询过程中,指定筛选条件,满足条件的记录就保留,不满足条件的就跳过.....  


     比较运算符    



    null 参与运算或者比较,得到的结果也是 null   

mysql> insert into exam1 values(null, null , null, null, 90.0);
Query OK, 1 row affected (0.03 sec)



select* from exam1;
+------+-----------+---------+------+---------+
| id   | name      | Chinese | Math | English |
+------+-----------+---------+------+---------+
| NULL | NULL      |    NULL | NULL |    90.0 |
+------+-----------+---------+------+---------+
8 rows in set (0.00 sec)



select  name, Chinese + math + English as total from exam1;
+-----------+-------+
| name      | total |
+-----------+-------+
| NULL      |  NULL |
+-----------+-------+
8 rows in set (0.01 sec)
  • null = null => null,此时的表达式的值是 null 的时候,条件就会判定为"不成立",也就相当于 false 
  • <=> 也是比较相等,能够针对 NULL 和 NULL 进行比较的.,NULL <=> NULL=> true


      逻辑运算符     



3.1 基本查询

遍历表的每个记录(每一行),把每一行的数据带入到条件中.
如果条件成立,这个记录就添加到结果集合中;如果不成立,就直接跳过. 


    查询英语不及格的同学及英语成绩    


select name , English from exam1 where English < 60;

    查询语文成绩大于英语成绩的同学    


select name ,Chinese, English from exam1 where Chinese > English;

本次查询过程和刚刚一样,也是把每一条查询到的记录带入 where 后面的条件,把符合条件的记录添加到结果集,不满足条件的记录直接跳过;


    别名无法作为 where 后面的条件    


select  name, Chinese + math + English as total from exam1 where total < 200;

ERROR 1054 (42S22): Unknown column 'total' in 'where clause'

 解析:这个错误其实是因为 SQL 语句执行顺序造成的:

虽然 where 是写在 SQL 语句末尾,但是执行顺序是在定义别名之前的 ,因此在执行 where 条件时,如果条件中有别名,该别名是未被定义的;


3.2 AND和OR

    查询语文成绩大于80分英语成绩大于80分的同学    


select name , Chinese , English from exam1 where Chinese > 80 and English > 80;

    查询语文成绩大于80分英语成绩大于80分的同学     


select name , Chinese , English from exam1 where Chinese > 80 or English > 80;

    注意: 

and 和  or 同时出现会有优先级,但是如果表达式比较复杂,包含多组 and 和 or,就给需要先运算的部分加括号即可;


3.3 范围查询

    查询语文成绩在[80,90]分的同学及语文成绩    


select name, Chinese from exam1 where Chinese between 80 and 90;  

 


    查询数学成绩是58 或者59 或者 98 或者99 分的同学及数学成绩     

select name, math from exam1 where math in(58, 59, 98, 99);

    总结    

  • 如果查询的区间是连续的,就使用 between....and;
  • 如果查询的区间是离散的(某几个值),就使用 in() ; 

3.4 模糊查询

不要求完全相等,只要满足一定的条件就可以了. 


    %匹配任意个数字符     


-- 查询所有名字以孙开头的同学

select* from exam1 where name like '孙%';


-- 查询所有名字以孙结尾的同学

select* from exam1 where name like '%孙';


-- 查询所有名字有孙的同学

select* from exam1 where name like '%孙%';

    _匹配一个个数字符      

select* from exam1 where name like '孙_';    -- 查询孙某



select* from exam1 where name like '孙__';   -- 查询孙某某

想要查询名字中孙只在中间部分,不能在开头和结尾部分的需求,在数据库中实现有一定难度;

mysql 自带的模糊匹配功能相对比较弱;

如果后续要使用正则表达式,直接搜即可;在 sql 中,like 不能支持正则的,只能简单使用% 或者_来匹配;使用其他编程语言间接的操作 sql 即可;


3.5 NULL的查询

     查询 id 为NULL的记录      



select* from exam1 where id <=> null ;    -- 使用 <=> 判断 id 是否为 null


select* from exam1 where id is null;      -- 使用 is  判断 id 是否为 null


4 Order by 排序


    语法:  


select 列名,列名.... from exam order by 列名 desc ;  # 降序 (从高到低)


select 列名,列名.... from exam order by 列名 asc  ;  # 升序 (从低到高)


-- 注意:NULL被看做比任何值都小

    注意: 

  • 数据库不会对于查询得到的结果集的顺序,做出任何承诺(不一定会根据序号,插入顺序...等等因素来决定结果集的顺序)除非 sql 中包含 order by
  • 如果不写 order,得到的结果的顺序是不可预期的.....写代码就不能依赖这样的顺序;

    按语文成绩从低到高排序(不指定顺序,默认从低到高)    


 select* from exam1 order by Chinese;
+------+-----------+---------+------+---------+
| id   | name      | Chinese | Math | English |
+------+-----------+---------+------+---------+
|    5 | 刘玄德    |    55.0 | 85.0 |    45.0 |
|    1 | 唐三藏    |    67.0 | 98.0 |    56.0 |
|    6 | 孙权      |    70.0 | 73.0 |    78.0 |
|    7 | 宋公明    |    75.0 | 65.0 |    30.0 |
|    4 | 曹孟德    |    82.0 | 84.0 |    67.0 |
|    2 | 孙悟空    |    87.0 | 78.0 |    77.0 |
|    3 | 猪悟能    |    88.0 | 98.0 |    90.0 |
+------+-----------+---------+------+---------+
7 rows in set (0.00 sec)

对语文进行排序后,每一行的数据也会以语文成绩为基准进行排序; 


   查询同学各门成绩,依次按数学降序,英语升序,语文升序的方式显示     


select name, math, English, Chinese from exam1 order by 
math desc, 
English asc, 
Chinese asc;


+-----------+------+---------+---------+
| name      | math | English | Chinese |
+-----------+------+---------+---------+
| 唐三藏    | 98.0 |    56.0 |    67.0 |
| 猪悟能    | 98.0 |    90.0 |    88.0 |
| 刘玄德    | 85.0 |    45.0 |    55.0 |
| 曹孟德    | 84.0 |    67.0 |    82.0 |
| 孙悟空    | 78.0 |    77.0 |    87.0 |
| 孙权      | 73.0 |    78.0 |    70.0 |
| 宋公明    | 65.0 |    30.0 |    75.0 |
+-----------+------+---------+---------+
7 rows in set (0.00 sec)


     可以使用列的别名进行排序     


select name, Chinese + Math + English as total from exam1 order by total desc;
+-----------+-------+
| name      | total |
+-----------+-------+
| 猪悟能    | 276.0 |
| 孙悟空    | 242.0 |
| 曹孟德    | 233.0 |
| 唐三藏    | 221.0 |
| 孙权      | 221.0 |
| 刘玄德    | 185.0 |
| 宋公明    | 170.0 |
| NULL      |  NULL |
+-----------+-------+

-- null 和任何数的计算结果都为 null


5 分页查询 


  • select *容易查询出太多的数据,导致机器挂掉;
  • 通过指定列查询,虽然查到的结果是变少了很多,但是如果行数足够多的话,仍然是有可能会把机器搞出问题的;
  • 此时更稳妥的做法,就是"分页查询",限制一次查询,最多能查到多少个记录;

5.1 查询第一页数据

select 列名 from 表名 limit num ;

5.2 使用LIMIT子句进行分页查询 

-- 起始下标为 0


-- 从0开始,筛选 num 条结果
SELECT ... FROM table_name [WHERE ...] [ORDER BY ...] LIMIT num;


-- 从 start 开始,筛选 num 条结果
SELECT ... FROM table_name [WHERE ...] [ORDER BY ...] LIMIT start, num;


-- 从 start 开始,筛选 num条结果,比第二种用法更明确,建议使用
SELECT ... FROM table_name [WHERE ...] [ORDER BY ...] LIMIT num OFFSET start;

  

;