目录
前言:
我们之前讲解了二叉搜索树,今天来看AVL树。有了二叉搜索树,为什么还要AVL树呢?
二叉搜索树虽可以缩短查找的效率,但如果数据有序或接近有序二叉搜索树将退化为单支树,查找元素相当于在顺序表中搜索元素,效率低下。因此我们就需要AVL树出马了!
一、AVL树的概念
当向二叉搜索树中插入新结点后,如果能保证每个结点的左右子树高度之差的绝对值不超过1(需要对树中的结点进行调整),即可降低树的高度,从而减少平均搜索长度。
一棵AVL树或者是空树,或者是具有以下性质的二叉搜索树:
- 它的左右子树都是AVL树
- 左右子树高度之差(简称平衡因子)的绝对值不超过1(-1/0/1)
小问题:为什么是高度差不超过1,而不是相等呢?
答:两个结点如何做到相等?4个结点呢?结点是一个一个插入的,有些情况无法做到相等,最优就是高度差是1。
二、AVL树结点的定义
除了要定义结点的左孩子和右孩子,还需要定义该结点的双亲结点,和该结点的平衡因子,平衡因子就是判断以该节点为根的树是否为AVL树,如果不是就需要旋转调整。
原码:
template<class T>
struct AVLTreeNode
{
AVLTreeNode(const T& data = T())
: _pLeft(nullptr)
, _pRight(nullptr)
, _pParent(nullptr)
, _data(data)
, _bf(0)
{}
AVLTreeNode<T>* _pLeft;
AVLTreeNode<T>* _pRight;
AVLTreeNode<T>* _pParent;//双亲结点
T _data;
int _bf; // 节点的平衡因子
};
三、AVL树的插入
AVL树就是在二叉搜索树的基础上引入了平衡因子,因此AVL树也可以看成是二叉搜索树。那么AVL树的插入过程可以分为两步:
- 按照二叉搜索树的方式插入新节点
- 调整节点的平衡因子
问题:插入结点会影响哪些结点的平衡因子呢?
答:新增结点的部分祖先
更新原则:
c是p的左边,p->bf--
c是p的右边,p->bf++
是否要继续更新取决于p的高度是否会变化,是否会影响爷爷结点。
插入新节点后分为3种情况:
- 更新后,p->bf == 0, p所在的子树高度不变,不会影响爷爷,说明更新前,p的bf是1或者-1,p的矮的那边插入了结点,左右均衡了,p的高度不会变化,不会影响爷爷。(更新结束!)
- 更新后,p->bf == 1/-1, p所在的子树的高度变了,会影响爷爷,说明更新前,p的bf是0,p的有一边插入,p变得不均衡,但是不违反规则,p的高度变了,会影响爷爷(继续从爷爷结点开始判断,继续向上更新!)
- 更新后,p->bf == 2/-2,说明p所在的子树违反了平衡规则,需要进行旋转处理!(结束!旋转让p所在子树高度回到插入之前,不会对上层bf有影响)
原码:
// 在AVL树中插入值为data的节点
bool Insert(const T& data)
{
//先判断是否为空
if (_pRoot == nullptr)
{
_pRoot = new Node(data);
return true;
}
Node* parent = _pRoot;
Node* cur = _pRoot;
//先找到正确插入的位置
while (cur)
{
if (data > cur->_data)
{
parent = cur;
cur = cur->_pRight;
}
else if (data < cur->_data)
{
parent = cur;
cur = cur->_pLeft;
}
else
return false;
}
//找到位置直接插入
cur = new Node(data);
if (data > parent->_data)
parent->_pRight = cur;
else
parent->_pLeft = cur;
cur->_pParent = parent;
while (parent)
{
//更新平衡因子
if (parent->_pLeft == cur) parent->_bf--;
else parent->_bf++;
if (parent->_bf == 0) break;
//影响父节点的平衡因子
else if (parent->_bf == 1 || parent->_bf == -1)
{
cur = cur->_pParent;
parent = parent->_pParent;
}
else if (parent->_bf == 2 || parent->_bf == -2)
{
//旋转处理
if (parent->_bf == 2 && cur->_bf == 1)
{
RotateL(parent);
}
else if (parent->_bf == -2 && cur->_bf == -1)
{
RotateR(parent);
}
else if (parent->_bf == -2 && cur->_bf == 1)
{
RotateLR(parent);
}
else
{
RotateRL(parent);
}
//旋转之后直接就没有问题了
break;
}
else
{
//插入之前就有问题
return false;
}
}
}
四、AVL树的旋转
旋转的目的:
- 保持搜索规则
- 当前树从不平衡旋转为平衡
- 降低当前树的高度
如果在一棵原本是平衡的AVL树中插入一个新节点,可能造成不平衡,此时必须调整树的结构,使之平衡化。根据节点插入位置的不同,AVL树的旋转分为四种:
- 新节点插入较高左子树的左侧---左左:右单旋
- 新节点插入较高右子树的右侧---右右:左单旋
- . 新节点插入较高左子树的右侧---左右:先左单旋再右单旋
- 新节点插入较高右子树的左侧---右左:先右单旋再左单旋
右单旋:
将失衡结点进行右旋即可,从操作上来说就是将b变成60的左边、60变成30的右边、30变成当前树的根三个步骤
// 右单旋
void RotateR(Node* Parent)
{
Node* subL = Parent->_pLeft;
Node* subLR = subL->_pRight;
Node* pparent = Parent->_pParent;
if (pparent)
{
subL->_pParent = pparent;
if (pparent->_pLeft == Parent)
pparent->_pLeft = subL;
else
pparent->_pRight = subL;
}
else
{
subL->_pParent = nullptr;
}
subL->_pRight = Parent;
Parent->_pParent = subL;
Parent->_pLeft = subLR;
//判断是否是空指针
if (subLR)
subLR->_pParent = Parent;
//更新平衡因子
subL->_bf = 0;
Parent->_bf = 0;
}
左单旋:
将失衡结点向左旋转即可,从操作上来说就是b变成30的右边、30变成60的左边、60变成当前树的根三个步骤。
// 左单旋
void RotateL(Node* Parent)
{
Node* subR = Parent->_pRight;
//注意subRL有可能为空
Node* subRL = subR->_pLeft;
Node* pparent = Parent->_pParent;
//判断是否是根节点
if (pparent == nullptr)
{
subR->_pParent = nullptr;
}
else
{
subR->_pParent = pparent;
//连接根节点的父节点
if (pparent->_pLeft == Parent)
pparent->_pLeft = subR;
else
pparent->_pRight = subR;
}
subR->_pLeft = Parent;
Parent->_pParent = subR;
Parent->_pRight = subRL;
if (subRL)
subRL->_pParent = Parent;
//更新平衡因子
subR->_bf = 0;
Parent->_bf = 0;
}
左右双旋
先左旋左孩子,然后再右旋失衡结点
将双旋变成单旋后再旋转,即:先对30进行左单旋,然后再对90进行右单旋,旋转完成后再考虑平衡因子的更新。
经过双旋后的平衡因子如何修改也是一大难题!细分会有三种情况:
我们可以根据subLR的更新后的平衡因子进行区分这三种情况!准确的进行平衡因子的更新!
// 左右双旋
void RotateLR(Node* pParent)
{
Node* subL = pParent->_pLeft;
Node* subLR = subL->_pRight;
int bf = subLR->_bf;
//先左单旋
RotateL(pParent->_pParent);
//后右单旋
RotateR(pParent);
if (bf == -1)
{
subLR->_bf = 0;
subL->_bf = 0;
pParent->_bf = 1;
}
else if (bf == 1)
{
subLR->_bf = 0;
subL->_bf = -1;
pParent->_bf = 0;
}
else if (bf == 0)
{
subLR->_bf = 0;
subL->_bf = 0;
pParent->_bf = 0;
}
else
{
assert(false);
}
}
右左双旋
先右旋右孩子,然后再左旋失衡结点
具体讲解参考左右双旋
// 右左双旋
void RotateRL(Node* parent)
{
Node* subR = parent->_pRight;
Node* subRL = subR->_pLeft;
int bf = subRL->_bf;
RotateR(subR);
RotateL(parent);
subRL->_bf = 0;
if (bf == 1)
{
subR->_bf = 0;
parent->_bf = -1;
}
else if (bf == -1)
{
parent->_bf = 0;
subR->_bf = 1;
}
else
{
parent->_bf = 0;
subR->_bf = 0;
}
}
旋转要注意的事项:
- 不仅要动当前的几个结点,还要动parent
- subrl可能为空,如果为空,就会出现空指针的问题(也就是h可能为0的情况)
- 如果这是一个子树,还要跟根进行连接。(提前判断是否是子树)
那么这四种情况如何区分呢?
总结:
假如以pParent为根的子树不平衡,即pParent的平衡因子为2或者-2,分以下情况考虑
1. pParent的平衡因子为2,说明pParent的右子树高,设pParent的右子树的根为pSubR
当pSubR的平衡因子为1时,执行左单旋
当pSubR的平衡因子为-1时,执行右左双旋
2. pParent的平衡因子为-2,说明pParent的左子树高,设pParent的左子树的根为pSubL
当pSubL的平衡因子为-1是,执行右单旋
当pSubL的平衡因子为1时,执行左右双旋
旋转完成后,原pParent为根的子树个高度降低,已经平衡,不需要再向上更新。
首先讲讲单旋和双旋的区分,只需要旋转一次的单旋是因为无论是左单旋还是右单旋,新增的结点都是在同一边的,从失衡结点的平衡因子的正负来看,都是同正或者同负的!
而之所以要双旋是因为,插入的新节点和原先并不在同一边,从失衡结点的平衡因子的正负来看,都是一个为正,一个为负,所以需要先旋转一次,变为同一边,接着再重复单旋的过程!
五、AVL树的验证
AVL树是在二叉搜索树的基础上加入了平衡性的限制,因此要验证AVL树,可以分两步:
1. 验证其为二叉搜索树
如果中序遍历可得到一个有序的序列,就说明为二叉搜索树
2. 验证其为平衡树
直接根据概念,左右子树的高度差不超过2
思路:
采用后续遍历,并且多传一个高度为h的引用参数,用来记录当前树的高度,这样防止了前序的重复遍历。
原码:
// AVL树的验证
bool IsAVLTree()
{
int h = 0;
return _IsAVLTree(_pRoot, h);
}
bool _IsAVLTree(Node* root, int& height)
{
if (root == nullptr)
{
height = 0;
return true;
}
int leftHeight = 0, rightHeight = 0;
if (!_IsAVLTree(root->_pLeft, leftHeight)
|| !_IsAVLTree(root->_pRight, rightHeight))
{
return false;
}
if (abs(rightHeight - leftHeight) >= 2)
{
cout << root->_data << "不平衡" << endl;
return false;
}
if (rightHeight - leftHeight != root->_bf)
{
cout << root->_data << "平衡因子异常" << endl;
return false;
}
height = leftHeight > rightHeight ? leftHeight + 1 : rightHeight + 1;
return true;
}