目录
4.serializable (串行化):解决上面所有问题,包括脏写
5.serializable(串行化):解决上面所有问题,包括脏写
三、MVCC(Multi-VersionConcurrency Control)多版本并发控制
一、概述
我们的数据库一般都会并发执行多个事务,多个事务可能会并发的对相同的一批数据进行增删改查操作,可能就会导致我们说的脏写、脏读、不可重复读、幻读这些问题。
这些问题的本质都是数据库的多事务并发问题,为了解决多事务并发问题,数据库设计了事务隔离机制、锁机制、MVCC多版本并发控制隔离机制、日志机制,用一整套机制来解决多事务并发问题。
二、事务
事务是一组操作要么全部成功,要么全部失败,目的是为了保证数据最终的一致性。
(一)事务的ACID属性
- 原子性(Atomicity) :当前事务的操作要么同时成功,要么同时失败。原子性由undo log日志来实现。
- 一致性(Consistent) :使用事务的最终目的,由其它3个特性以及业务代码正确逻辑来实现。
- 隔离性(Isolation) :在事务并发执行时,他们内部的操作不能互相干扰。隔离性由MySQL的各种锁以及MVCC机制来实现。
- 持久性(Durable) :一旦提交了事务,它对数据库的改变就应该是永久性的。持久性由redo log日志来实现。
(二)并发事务处理带来的问题
更新丢失(Lost Update)或脏写
当两个或多个事务选择同一行数据修改,有可能发生更新丢失问题,即最后的更新覆盖了由其他事务所做的更新。
脏读(Dirty Reads)
事务A读取到了事务B已经修改但尚未提交的数据
不可重读(Non-Repeatable Reads)
事务A内部的相同查询语句在不同时刻读出的结果不一致
幻读(Phantom Reads)
事务A读取到了事务B提交的新增数据
(三)事务隔离级别(4种)
InnoDB引擎中,定义了四种隔离级别供我们使用,级别越高事务隔离性越好,但性能就越低,而隔离性是由MySQL的各种锁以及MVCC机制来实现的。
1.read uncommit (读未提交):脏读
事务A读取到了事务B已经修改但尚未提交的数据
2.read commit (读已提交):不可重复读
事务A内部的相同查询语句在不同时刻读出的结果不一致(事务B提交修改后的数据,事务A能读取出来)
例子(乐观锁程序实现):Java 运算1000+500=1500(version = 1), 另一个事务B已经更新balance=2500( version = 2)
update account set balance = 1500 where id= 1 (错误,真实的balance=2500)
增加版本号字段version(有update就+1)
update account set where id= 1 and balance = 1500 version = 1(未修改成功返回i=0)
Java 加if 判断 if(i=0 //再执行一次){select version,balance from table where id= 1 => version = 2, balance=2500}
update account set where id= 1 and balance = 3000 and version = 2(修改成功数据正确)
3.repeatable read (可重复读) :幻读
1.事务A读取到了事务B提交的新增数据
2.事务A内部的相同查询语句在不同时刻读出的结果一致,事务B修改同一条并提交也不影响事务A
3.事务A如果update修改事务B已经修改提交的数据,则事务A能在当条数据的最新的数据上update,其他数据行不受影响,读取的还是和事务开始时的一样
4.serializable (串行化):解决上面所有问题,包括脏写
“脏读”、“不可重复读”和“幻读”,其实都是数据库读一致性问题,必须由数据库提供一定的事务隔离机制来解决。
隔离级别 | 脏读(Dirty Read) | 不可重复读(NonRepeatable Read) | 幻读(Phantom Read) |
读未提交(Read uncommitted) | 可能 | 可能 | 可能 |
读已提交(Read committed) | 不可能 | 可能 | 可能 |
可重复读(Repeatableread) | 不可能 | 不可能 | 可能 |
可串行化(Serializable) | 不可能 | 不可能 | 不可能 |
数据库的事务隔离越严格,并发副作用越小,但付出的代价也就越大,因为事务隔离实质上就是使事务在一定程度上“串行化”进行,这显然与“并发”是矛盾的。
同时,不同的应用对读一致性和事务隔离程度的要求也是不同的,比如许多应用对“不可重复读"和“幻读”并不敏感,可能更关心数据并发访问的能力。
查看当前数据库的事务隔离级别: show variables like 'tx_isolation';
设置事务隔离级别:set tx_isolation='REPEATABLE-READ';
Mysql默认的事务隔离级别是可重复读,用Spring开发程序时,如果不设置隔离级别默认用Mysql设置的隔离级别,如果Spring设置了就用已经设置的隔离级别。
(四)事务隔离级别案例分析
CREATE TABLE `account` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`name` varchar(255) DEFAULT NULL,
`balance` int(11) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
INSERT INTO `account` (`name`, `balance`) VALUES ('lilei', '500');
INSERT INTO `account` (`name`, `balance`) VALUES ('hanmei', '1000');
INSERT INTO `account` (`name`, `balance`) VALUES ('lucy', '1500');
set tx_isolation='read-uncommitted';//读未提交
set tx_isolation='read-committed';//读已提交
set tx_isolation='repeatable-read';//可重复读
set tx_isolation='serializable';//串行化
1.read uncommit (读未提交):脏读
旧版本(5.x)的变量是tx_isolation,新版本(8.x)的系统变量改成transaction_isolation
初始数据
事务A update但是没有commit, 真实数据还是balance=500;但是事务B查出的数据是balance=1000,数据不一致了
一旦事务A因为某种原因回滚,所有的操作都将会被撤销,那事务B查询到的数据其实就是脏数据:
2.read commit (读已提交):不可重复读
初始数据
例子1:事务A update但是没有commit,事务B查出的数据是balance=500,数据一致,解决了脏读问题
事务A commit后,事务B查出的数据是balance=1000(事务B未commit),产生了不可重复读的问题
例子2:初始balance=1000,事务A update但是未commit,事务B查出的数据是balance=1000
事务C(与事务B在同一隔离级别下) update并commit,事务A未commit,事务B查出的数据是balance=1500,产生了不可重复读的问题
如果是mysql8.0版本,事务C(与事务B在同一隔离级别下) update并commit,事务A未commit,事务B查出的数据会是balance=2000
3.幻读问题描述
例子1:.事务A insert表数据中不存在的数据,未commit,事务B也执行一样的操作,发现插入不了表中不存在的数据,类似于出现幻影,因而称之为幻读:
例子2:事务A 查询表中不存在的id=6数据未commit,事务B插入事务A中查询的id=6数据,事务A更新id=6数据且更新成功:
4.repeatable read (可重复读) :幻读
这个隔离级别记住一句话就能理解:可重复读隔离级别在事务开启的时候,第一次查询是查的数据库里已提交的最新数据,这时候全数据库会有一个快照(当然数据库并不是真正的生成了一个快照),在这个事务之后执行的查询操作都是查快照里的数据,别的事务不管怎么修改数据对当前这个事务的查询都没有影响,但是当前事务如果修改了某条数据,那当前事务之后查这条修改的数据就是被修改之后的值,但是查其它数据依然是从快照里查,不受影响。
初始数据
事务A如果update修改事务B已经修改提交的数据,则事务A能在当条数据的最新的数据上update(此时查询这条id=1的数据就是更新后的数据,即使未commit),其他数据行不受影响,即使insert新的数据,读取的还是和事务开始时的一样
这个事务级别更新数据不能在Java计算+500后再update,会覆盖其他事务update修改后的数据,应该在sql set balance = balance+500
5.serializable(串行化):解决上面所有问题,包括脏写
事务A查询id为1的记录,事务B更新相同的id为1的记录会被阻塞等待,更新id为2的记录可以成功,说明在串行模式下innodb的查询也会被加上行锁,如果查询的记录不存在会给这条不存在的记录加上锁(这种是间隙锁)。
如果客户端A执行的是一个范围查询,那么该范围内的所有行包括每行记录所在的间隙区间范围都会被加锁。此时如果客户端B在该范围内插入数据都会被阻塞,所以就避免了幻读。
这种隔离级别并发性极低,开发中很少会用。
(五)锁
读锁 读锁是共享的,多个事务可以同时读取同一个资源,但不允许其他事务修改
写锁(排它锁、X锁):select for update;... 写锁是排他的,会阻塞其他的写锁和读锁,update、delete、insert都会加写锁
三、MVCC(Multi-VersionConcurrency Control)多版本并发控制
MVCC多版本并发控制,就可以做到读写不阻塞,且避免了类似脏读这样的问题,主要通过undo日志链来实现
- select操作是快照读(历史版本)
- insert、update和delete是当前读(当前版本)
- 事务A update数据未提交,事务B不能update相同语句,数据行已加锁(悲观锁)
- readcommit (读已提交) ,语句级快照
- repeatableread (可重复读),事务级快照
(一)隔离级别选择
- 业务并发要求高的选择readcommit (读已提交)
- 业务并发要求不高、对数据的时间维度要求更统一的选择repeatableread (可重复读)
(二)查询操作方法需要使用事务吗?
分情况:
1.如果是只读取一条数据则不需要加事务
2.如果读取多条则看使用的事务级别
- 如果是readcommit (读已提交) ,则不需要,
- 如果是repeatableread (可重复读),则需要(假如在统计报表,多条数据查询不加事务,读取出来的数据可能不是同一时间维度的,还要对数据进行计算,就会有问题)
(三)事务持久性
MySQL引入了redolog,Buffer Pool内存写完了,然后会写一份redo log,这份redo log记载着这次在某个页上做了什么修改。
即便MySQL在中途挂了,我们还可以根据redolog来对数据进行恢复(redo日志与page页数据比对,发现不同,更新最新数据,防止数据丢失)。
redolog (写之前会开辟一大块内存)是磁盘顺序写的,写入速度很快。并且它记录的是物理修改(xxxx页做了xxx修改),文件的体积很小,恢复速度也很快。
磁盘文件ibd,每个表都有一个单独的ibd文件,可能存在磁盘的不同地方,不可能是磁盘顺序写。
(四)事务问题定位
#查询执行时间超过1秒的事务,详细的定位问题方法后面讲完锁课程后会一起讲解
SELECT
*
FROM
information_schema.innodb_trx
WHERE
TIME_TO_SEC( timediff( now( ), trx_started ) ) > 1;
#强制结束事务
kill 事务对应的线程id(就是上面语句查出结果里的trx_mysql_thread_id字段的值)
(五)大事务的影响
- 并发情况下,数据库连接池容易被撑爆
- 锁定太多的数据,造成大量的阻塞和锁超时
- 执行时间长,容易造成主从延迟(数据延迟)
- 回滚所需要的时间比较长
- undo log膨胀(回滚需要按照每条数据的寻找对应的undo日志版本链进行回滚)
- 容易导致死锁
(六)事务优化
- 将查询等数据准备操作放到事务外 (read commit (读已提交)无影响, repeatable read (可重复读)有影响)
- 事务中避免远程调用,远程调用要设置超时,防止事务等待时间太久(防止死锁一直等待)
- 事务中避免一次性处理太多数据,可以拆分成多个事务分次处理(1000条可分10次插入,避免长时间占用事务,让别的事务无法操作)
- 更新等涉及加锁的操作尽可能放在事务靠后的位置(先insert再update,防止多个事务update同一行数据等待)
- 能异步处理的尽量异步处理
- 应用(业务代码)保证数据一致性,非事务执行(多个try,catch,回滚,不推荐)