Bootstrap

MySQL 索引

MySQL 索引

一、介绍

索引是通过某种算法,构建出一个数据模型,用于快速找出在某个列中有一特定值的行,不使用索引,MySQL必须从第一条记录开始读完整个表,直到找出相关的行,表越大,查询数据所花费的时间就越多,如果表中查询的列有一个索引,MySQL能够快速到达一个位置去搜索数据文件,而不必查看所有数据,那么将会节省很大一部分时间。

索引类似一本书的目录,比如要查找’student’这个单词,可以先找到s开头的页然后向后查找,这个就类似索引。

二、索引的分类

索引是存储引擎用来快速查找记录的一种数据结构

  1. 按照实现的方式分类,主要有Hash索引B+Tree索引

  2. 按照功能划分,索引划为以下分类:

三、单列索引、组合索引

1、创建索引

  1. 创建表时直接指定

    CREATE TABLE student(
      sid int primary key,	-- 主键是具有唯一性并且不允许为NULL,所以他是一种特殊的唯一索引
      card_id varchar(20),
      name varchar(20),
      gender varchar(20),
      age int,
      birth date,
      phone_num varchar(20),
      score double,
      index index_name(name),		-- 给name列创建普通索引
      unique index_card_id(card_id) -- 给card_id列创建唯一索引
    ) 
    
  2. 直接创建

    create index index_gender on student(gender);		-- 普通索引
    create unique index index_card_id on student(card_id); -- 唯一索引
    
    create index index_phone_name on student(phone_num, name);	-- 组合普通索引
    create unique index index_phone_name on student(phone_num, name); -- 组合唯一索引
    
  3. 修改表结构(添加索引)

    alter table student add index index_age(age);
    alter table student add unique index_phone_num(phone_num);
    

2、查看索引

-- 1、查看数据库中所有索引
select * from mysql.`innodb_index_stats` a where a.`database_name` = 'mydb';

-- 2、查看表中所有索引
select * from mysql.`innodb_index_stats` a where a.`database_name` = 'mydb' and a.table_name = 'student';

-- 3、查看表中所有索引
show index from student;	-- 信息会少一些

navicat工具:鼠标右击表 -> 点击设计表 -> 点击上方索引 也可查看
在这里插入图片描述

3、删除索引

-- 1、直接删除
drop index index_name on student;
drop index index_gender on student;
drop index index_card_id on student;
drop index index_phone_name on student;

-- 2、修改表结构删除
alter table student drop index index_age;
alter table student drop index index_phone_num;

4、注意事项

  1. 组合索引也叫复合索引,指的是我们在建立索引的时候使用多个字段,例如同时使用身份证和手机号建立索引,同样的可以建立为普通索引或者是唯一索引。
  2. 复合索引的使用复合最左原则。

例如:

-- create unique index index_phone_name on student(phone_num, name); -- 组合唯一索引
select * from student where name = '张三'; 
select * from student where phone_num = '15100046637'; 
select * from student where phone_num = '15100046637' and name = '张三'; 
select * from student where name = '张三' and phone_num = '15100046637'; 
  • 三条sql只有 2 、 3、4能使用的到索引idx_phone_name,因为条件里面必须包含索引前面的字段 才能够进行匹配。

  • 而3和4相比where条件的顺序不一样,为什么4可以用到索引呢?是因为mysql本身就有一层sql优化,他会根据sql来识别出来该用哪个索引,我们可以理解为3和4在mysql眼中是等价的。

四、全文索引

1、创建索引

-- 创建表的适合添加全文索引
create table t_article (
     id int primary key auto_increment ,
     title varchar(255) ,
     content varchar(1000) ,
     writing_date date -- , 
     -- fulltext (content) -- 创建全文检索
);

插入数据后添加索引

insert into t_article values(null,"Yesterday Once More","When I was young I listen to the radio",'2024-07-01');
insert into t_article values(null,"Right Here Waiting","Oceans apart, day after day,and I slowly go insane",'2024-07-02'); 
insert into t_article values(null,"My Heart Will Go On","every night in my dreams,i see you, i feel you",'2024-07-03');
insert into t_article values(null,"Everything I Do","eLook into my eyes,You will see what you mean to me",'2024-07-04');
insert into t_article values(null,"Called To Say I Love You","say love you no new year's day, to celebrate",'2024-07-05');
insert into t_article values(null,"Nothing's Gonna Change My Love For You","if i had to live my life without you near me",'2024-07-06');
insert into t_article values(null,"Everybody","We're gonna bring the flavor show U how.",'2021-10-07');
-- 修改表结构添加全文索引
alter table t_article add fulltext index_content(content)

-- 添加全文索引
create fulltext index index_content on t_article(content);

2、使用全文索引

和常用的模糊匹配使用 like + % 不同,全文索引有自己的语法格式,使用 match 和 against 关键字,格式:

match (col1,col2,...)  against(expr [search_modifier])
select * from t_article where match(content) against('yo');  -- 没有结果(搜索长度小于3)
select * from t_article where match(content) against('you'); -- 有结果	
-- 普通搜索(上面比这个查询快很多)
select * from t_article where content like '%you%'; 

3、注意事项

1、全文索引主要用来查找文本中的关键字,而不是直接与索引中的值相比较

  • 全文索引主要用来查找文本中的关键字,而不是直接与索引中的值相比较,它更像是一个搜索引擎,基于相似度的查询,而不是简单的where语句的参数匹配。
  • 用 like + % 就可以实现模糊匹配了,为什么还要全文索引?like + % 在文本比较少时是合适的,但是对于大量的文本数据检索,是不可想象的。全文索引在大量的数据面前,能比 like + % 快 N 倍,速度不是一个数量级,但是全文索引可能存在精度问题。

2、测试或使用全文索引时,要先看一下自己的 MySQL 版本、存储引擎和数据类型是否支持全文索引。

  • MySQL 5.6 以前的版本,只有 MyISAM 存储引擎支持全文索引;
  • MySQL 5.6 及以后的版本,MyISAMInnoDB 存储引擎均支持全文索引;
  • 只有字段的数据类型为 charvarchartext 及其系列才可以建全文索引
  • 在数据量较大时候,现将数据放入一个没有全局索引的表中,然后再用create index创建fulltext索引,要比先为一张表建立fulltext然后再将数据写入的速度快很多;

3、想对一个词语使用全文索引搜索,那么这个词语的长度必须在以上两个变量的区间内

  • MySQL 中的全文索引,有两个变量,最小搜索长度和最大搜索长度,对于长度小于最小搜索长度和大于最大搜索长度的词语,都不会被索引。这两个的默认值可以使用以下命令查看:

    show variables like '%ft%';
    

    默认innodb搜索引擎下最下3,最大84

五、空间索引

1、介绍

  • MySQL在5.7之后的版本支持了空间索引,而且支持OpenGIS几何数据模型
  • 空间索引是对空间数据类型的字段建立的索引,MYSQL中的空间数据类型有4种,分别是GEOMETRY、POINT、LINESTRING、POLYGON。
  • MYSQL使用SPATIAL关键字进行扩展,使得能够用于创建正规索引类型的语法创建空间索引。
  • 创建空间索引的列,必须将其声明为NOT NULL。
  • 空间索引一般是用的比较少,了解即可。

2、操作

类型含义说明
Geometry空间数据任何一种空间类型
Point坐标值
LineString线有一系列点连接而成
Polygon多边形由多条线组成
create table shop_info (
  id int primary key auto_increment comment 'id',
  shop_name varchar(64) not null comment '门店名称',
  geom_point geometry not null comment '经纬度',
  spatial key geom_index(geom_point)
);

六、索引的原理、优缺点、创建原则

原理

了解数据结构:Hash算法、二叉树、平衡二叉树、BTREE树(B-Trees、B+Trees)

数据结构可视化Data Structure Visualization (usfca.edu)

MyISAM和InnoDB引擎都使用B+Tree

  • MyISAM引擎使用B+Tree作为索引结构,叶节点的data域存放的是数据记录的地址。
  • InnoDB的叶节点的data域存放的是数据,相比MyISAM效率要高一些,但是比较占硬盘内存大小。

优点

  • 大大加快数据的查询速度
  • 使用分组和排序进行数据查询时,可以显著减少查询时分组和排序的时间
  • 创建唯一索引,能够保证数据库表中每一行数据的唯一性
  • 在实现数据的参考完整性方面,可以加速表和表之间的连接

缺点

  • 创建索引和维护索引需要消耗时间,并且随着数据量的增加,时间也会增加
  • 索引需要占据磁盘空间
  • 对数据表中的数据进行增加,修改,删除时,索引也要动态的维护,降低了维护的速度

创建索引的原则

  • 更新频繁的列不应设置索引
  • 数据量小的表不要使用索引(毕竟总共2页的文档,还要目录吗?)
  • 重复数据多的字段不应设为索引(比如性别,只有男和女,一般来说:重复的数据超过百分之15就不该建索引)
    考完整性方面,可以加速表和表之间的连接

缺点

  • 创建索引和维护索引需要消耗时间,并且随着数据量的增加,时间也会增加
  • 索引需要占据磁盘空间
  • 对数据表中的数据进行增加,修改,删除时,索引也要动态的维护,降低了维护的速度

创建索引的原则

  • 更新频繁的列不应设置索引
  • 数据量小的表不要使用索引(毕竟总共2页的文档,还要目录吗?)
  • 重复数据多的字段不应设为索引(比如性别,只有男和女,一般来说:重复的数据超过百分之15就不该建索引)
  • 首先应该考虑对where 和 order by 涉及的列上建立索引
;