引言
事务处理技术包括数据库恢复技术和并发控技术。事务是恢复和并发控制的基本单位。数据库在运行中,故障是难免的,发生了故障,就要恢复。
事务的基本概念
1、事务(Transaction)的概念
事务是用户定义的一个数据库操作序列,这些操作要么全做,要么全不做,是一个不可分割的工作单位。[银行转账案例来说明]
例: 从A账户向B账户转账。(A-1000 , B+1000)
事务的定义有两种方式:
显式的定义事务:
事务的开始与结束由用户显示控制,在SQL中,定义事务有3条语句。
隐式事务:
用户没有显式定义,由DBMS按缺省规定自动开始与结束事务。
2、事务的特性
事务具有四个特性(重点掌握):
(1) 原子性(Atomicity)
(2) 一致性(Consistency)
(3) 隔离性(Isolation)、
(4) 持续性(Durability)。这四个特性简称ACID特性。
原子性(事务是数据库的逻辑工作单位,要么都做,要么都不做):
事务是数据库的逻辑工作单位,事务中包括的诸操作要么都做,要么都不做。
一致性(一个一致性状态变到另一个一致性状态):
事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态。
例: 从A账户向B账户转账。(A-1000 , B+1000)
隔离性(一个事务执行不能被其它事务干扰):
一个事务的执行不能被其他事务干扰。即一个事务内部的操作及使用的数据对其他并发事务是隔离的,并发执行的各个事务之间不能互相干扰。
隔离性是针对并发执行而言的。
例:
T1的修改被T2覆盖了,事务T1、T2对同一数据进行操作,互相干扰了,破坏了事务的隔离性,使事务处在不一致的状态。
持续性:
持续性也称永久性(Permanence)。一个事务一日提交,它对数据库中数据的改变就应该是永久性的。接下来的其他操作或故障不应该对其执行结果有任何影响
事务是恢复和并发控制的基本单位。
保证事务ACID特性是事务管理的重要任务。
事务ACID特性可能遭到破坏的因素有:
(1)多个事务并行运行时,不同事务的操作交叉执行:
(2)事务在运行过程中被强行停止。
保证事务ACID特性是DBMS中恢复机制和并发控制机制的责任。
数据库恢复概述
1、故障是不可避免的
(1)计算机硬件故障
(2)系统软件和应用软件的错误
(3)操作员的失误→恶意的破坏
这些故障轻则造成运行事务非正常中断,影响数据库中数据的正确性:重则破坏数据库,使数据库中全部或部分数据丢失。
因此数据库管理系统必须具有把数据库从错误状态恢复到某一已知的正确状态的功能,这就是数据库的恢复。
2、故障的种类(4类,需掌握)
(1)事务内部的故障
事务内部的故障有的是可预期的[可以通过事务程序本身发现的】
有的是非预期的[不能由事务程序处理的]。
I. 对于可预期的故障,通过回滚事务,恢复数据库的正确状态。
II. 事务内部的故障主要指非预期的故障。如运算溢出;并发事务发生死锁而被选中撤销该事务;违反了某些完整性限制等。
事务故障意味着事务没有达到预期的终点,因此,数据库可能处于不正确状态。
恢复程序要在不影响其他事务运行的情况下,强行回滚该事务,即撤销该事务已经做出的任何对数据库的修改,使得该事务好像根本没有启动一样。这类恢复操作称为事务撤销(UNDO)。
列:
已经进行删除操作,进行事务撤销时需要进行插入操作
已经进行修改操作(新的覆盖旧的),进行事务撤销时就需要进行旧的内容覆盖新的内容
(2)系统故障(软故障)
系统故障是指造成系统停止运转的任何事件,使得系统要重新启动。
例如:
→特定类型的硬件错误(CPU故障)
→操作系统故障
→DBMS错误
→系统断电
这类故障影响正在运行的所有事务,但不破坏数据库。表现在主存内容,尤其是数据库缓冲区中的内容都被丢失,所有运行的事务都非正常终止,造成数据库可能处于不正确的状态。
为保证数据一致性,需要清除这些事务对数据库的所有修改:
一方面,对于未完成的事务,系统重新启动时,让所有非正常终止的事务回滚,强行撤销(UNDO)所有未完成的事务。
另一方面,对于已完成的事务,可能有一部分甚至全部留在缓冲区,尚未写回到磁盘上的物理数据库中,系统故障使得这些事务对数据库的修改部分或全部丢失。系统重新启动时,还需重做(REDO)所有已提交的事务。
(3)介质故障(硬故障)
介质故障指外存故障,如磁盘损坏、强磁场干扰等。这类故障将破坏数据库或部分数据库,并影响正在存取这部分数据的所有事务。这类故障发生的可能性小,但破坏性大。
(4)计算机病毒
计算机病毒已成为计算机系统的主要威胁,自然也是数据库系统的主要威胁一日被破坏也要用恢复技术把数据库加以恢复。
总结各类故障,对数据库的影响有两种可能性:
→数据库本身被破坏
→数据库没有被破坏,但数据可能不正确。
恢复的基本原理很简单:
冗余数据,通过存储在别处的数据(副本数据)来重建。
3、 恢复的实现技术
恢复机制涉及的两个关键问题是:
→如何建立冗余数据
→如何利用这些冗余数据实施数据库恢复
建立冗余数据最常用的技术是数据转储和登录日志文件。
通常这两种方法一起使用。
(1) 数据转储
转储是指DBA定期将整个数据库复制到磁带、磁盘或其他存储介质上保存起来的过程。这些备用的数据称为后备副本或后援副本。
[当数据库遭到破坏后可以将后备副本重新装入,但重装后备副本只能将数据库恢复到转储时的状态,要想恢复到故障发生时的状态,必须重新运行自转储以后的所有更新事务。画图说明]教材P297
根据转储过程中是否有事务运行,转储可分为静态转储和动态转储。
静态转储:
在系统中无运行事务时进行的转储操作。
1、可以得到一个数据一致性的副本
2、静态转储简单,但降低数据库的可用性。
动态转储:
指转储期间允许对数据库进行存取或修改。
即转储和用户事务可以并发执行。可以克服静态转储的缺点。
但转储结束时后援副本上的数据并不能保证正确有效。
解决办法:
把转储期间各事务对数据库的修改活动登记下来,建立日志文件。
转储还可以分为海量转储和增量转储两种方式。
→海量转储:
指每次转储全部数据库。
→增量转储:
指每次只转储上一次转储后更新过的数据。
从恢复角度看,使用海量转储得到的后备副本进行恢复一般说会更方便些。