Bootstrap

数据结构之树与二叉树

数据结构之树与二叉树

1.树的概念及结构
1.1.什么是树?

树是一种非线性的数据结构,它是由n(n>=0)个有限结点组成一个具有层次关系的集合。树是递归定义的。之所以把它叫做树是因为它看起来像一棵倒挂的树,它是根朝上,而叶朝下的。

根结点:有一个特殊的结点,根节点没有前驱结点。

除根节点外,其余结点被分成M(M>0)个互不相交的集合T1、T2、……、Tn,其中每一个集合Ti(1<= i<= n)又是一棵结构与树类似的子树。每棵子树的根结点有且只有一个前驱,可以有0个或多个后继。

1.2.树的逻辑图

树的逻辑图

1.3.树的相关概念

空树:树没有任何结点的树。

结点的度:一个结点含有的子树的个数称为该结点的度; 度为0的结点称为叶子结点;

双亲结点或父结点:若一个节点含有子结点,则这个节点称为其子结点的父结点;

孩子结点或结节点:一个节点含有的子树的根结点称为该节点的子结点;

兄弟结点:具有相同父结点的结点互称为兄弟结点;

树的度:一棵树中,最大的结点的度称为树的度;

结点的层次:从根开始定义起,根为第1层,根的子结点为第2层,以此类推; 树的高度或深度:树中结点的最大层次;

堂兄弟节结点:双亲在同一层的结点互为堂兄弟;

结点的祖先:从根到该节点所经分支上的所有节点;

子孙:以某节点为根的子树中任一节点都称为该节点的子孙;

森林:由m(m>=0)棵互不相交的树的集合称为森林。

1.4.树的表示

1.4.1.双亲表示法

取一块连续的内存空间,在存储每个结点的同时,各自都附加一个记录其双亲结点位置的变量。

双亲表示法

1.4.2孩子表示法

将树中的每个结点的孩子结点排列成一个线性表,用链表存储起来。对于含有 n 个结点的树来说,就会有 n 个单链表,将 n个单链表的头指针存储在一个线性表中。

如果结点没有孩子(例如叶子结点),那么它的单链表为空表

孩子表示法
1.4.2.孩子兄弟表示法:

二叉链表作树的存储结构。链表中的结点的两个链域分别指向该结点的第一个孩子和下一个兄弟结点。

孩子兄弟表示法

孩子兄弟表示法
代码表示:

typedef int DataType;
struct Node
{
	struct Node* _firstChild1; // 第一个孩子结点
	struct Node* _pNextBrother; // 指向其下一个兄弟结点
	DataType _data; // 结点中的数据域
}; 
1.5.树的应用

1. 哈夫曼编码(即带权路径长度最短的树),在数据压缩上有重要应用。
2. 海量数据并发查询
3. STL中的set/multiset、map,以及Linux虚拟内存的管理
4. B-树,B+树在文件系统中的目录应用
5. 路由器中的路由搜索引擎

2.二叉树的概念及结构
2.1.什么是二叉树?

二叉树:一棵二叉树是结点的一个有限集合,该集合或者为空,或者是由一个根节点加上两棵别称为左子树和右子树的二叉树组成 。

特点
1.每个结点最多有两棵子树,即二叉树不存在度大于2的结点。
2. 二叉树的子树有左右之分,其子树的次序不能颠倒。

2.2.二叉树的逻辑图

二叉树

2.3.特殊的二叉树

2.3.1.满二叉树

满二叉树:一个二叉树,如果每一个层的结点数都达到最大值,则这个二叉树就是满二叉树。也就是说,如果一个二叉树的层数为K,且结点总数是(2^k)-1 ,则它就是满二叉树。

满二叉树
2.3.2.完全二叉树

完全二叉树:完全二叉树是效率很高的数据结构,完全二叉树是由满二叉树而引出来的。对于深度为K的,有n个结点的二叉树,当且仅当其每一个结点都与深度为K的满二叉树中编号从1至n的结点一一对应时称之为完全二叉树。

注意:满二叉树是一种特殊的完全二叉树。

完全二叉树

2.4.二叉树的特殊性质

1. 若规定根节点的层数为1,则一棵非空二叉树的第i层上最多有 2^(i - 1) 个结点.

2. 若规定根节点的层数为1,则深度为h的二叉树的最大结点数是2^h - 1.

3. 对任何一棵二叉树, 如果其叶结点个数为 n0, 度为2的非叶结点个数为 n2,则有n0=n2+1.

4. 具有n个结点的完全二叉树的深度h=Log(n+1). (Log(n+1)是log以2为底,n+1为对数).

5. 对于具有n个结点的完全二叉树,如果按照从上至下从左至右的数组顺序对所有节点从0开始编号,则对 于序号为i的结点有:
1. 若i>0,i位置节点的双亲序号:(i-1)/2;i=0,i为根节点编号,无双亲节点
2. 若2i+1<n,左孩子序号:2i+1,2i+1>=n否则无左孩子
3. 若2i+2<n,右孩子序号:2i+2,2i+2>=n否则无右孩子

2.5 二叉树的存储结构

二叉树一般可以使用两种结构存储,一种顺序结构,一种链式结构.

2.5.1.顺序存储结构

顺序存储结构就是使用数组来存储,一般使用数组只适合表示完全二叉树,因为不是完全二叉树的二叉树会造成空间上的浪费。而现实中使用中只有堆才会使用数组来存储,二叉树顺序存储在物理上是一个数组,在逻辑上是一颗二叉树。

顺序存储结构
2.5.2.链式存储结构

链式存储结构是指用链表来表示一棵二叉树,即用链来指示元素的逻辑关系。
通常的方法是链表中每个结点由三个域组成,数据域和左右指针域,左右指针分别用来给出该结点左孩子和右孩子所在的链结点的存储地址。链式结构又分为二叉链和三叉链,红黑树等会用到三叉链。

链式存储结构
代码表示

// 二叉链
struct BinaryTreeNode
{
	struct BinTreeNode* _pLeft; // 指向当前节点左孩子
	struct BinTreeNode* _pRight; // 指向当前节点右孩子
	BTDataType _data; // 当前节点值域
} 
// 三叉链
struct BinaryTreeNode
{
	struct BinTreeNode* _pParent; // 指向当前节点的双亲
	struct BinTreeNode* _pLeft; // 指向当前节点左孩子
	struct BinTreeNode* _pRight; // 指向当前节点右孩子
	BTDataType _data; // 当前节点值域
}
3.二叉树的顺序结构及实现
3.1 二叉树的顺序结构

普通的二叉树是不适合用数组来存储的,因为可能会存在大量的空间浪费。而完全二叉树更适合使用顺序结构存储。现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储。

完全二叉树

3.2.堆的概念及结构

如果有一个关键码的集合K = {k0,k1, k2,…,kn-1},把它的所有元素按完全二叉树的顺序存储方式存储在一个一维数组中,并满足:Ki <= K2i + 1 且 Ki <= K2i + 2 (Ki >= K2i +1 且 Ki >= K2i + 2) i =0,1,2…,则称为小堆(或大堆)。将根节点最大的堆叫做最大堆或大根堆,根节点最小的堆叫做最小堆或小根堆。

小根堆与大根堆

堆的性质

1. 堆中某个节点的值总是不大于或不小于其父节点的值;
2. 堆总是一棵完全二叉树。

3.3.堆的向下调整

堆的向下调整
代码表示:

void AdjustDown(HPDataType* a, int n, int root)
{	
	assert(a);	
	int parent = root;	
	int child = root * 2 + 1;	
	while (child < n)	
	{		
		//选出较小的孩子		
		if (child + 1 < n && a[child + 1] > a[child])			
			++child;
			
		if (a[child] > a[parent])		
		{			
			Swap(&a[child], &a[parent]);			
			parent = child;			
			child = parent * 2 + 1;		
		}		
		else		
		{			
			break;		
		}	
	}
}	//向下调整算法
3.4.堆的插入

先插入一个数X到数组的尾上,再进行向上调整算法,直到满足堆 。

堆的插入

3.5.堆的删除

删除堆是删除堆顶的数据,将堆顶的数据根最后一个数据一换,然后删除数组最后一个数据,再进行向下调整算法。

堆的删除

3.6.堆排序

如果是升序,创建大堆之后堆中第1个数据是堆中最大的数据。取出这个数据,放在数组最后一个元素上,将当前元素数-1,再执行堆的删除操作。这样堆中第1个数据又是堆中最大的数据,重复上述步骤直至堆中只有一个数据时,数组元素就已经有序。

:堆排序的具体思路及实现详见排序博客选择排序部分。排序传送门

3.7.堆的代码实现

3.7.1.堆的结构

typedef int HPDataType;
typedef struct Heap
{
	HPDataType* _a;
	int _size;
	int _capacity;
}Heap; 

3.7.2.堆的基本操作(github链接)
堆的实现

4.二叉树链式结构的实现
4.1二叉树链式结构

二叉链表

4.2.前序/中序/后序的递归结构遍历

遍历(Traversal)是指沿着某条搜索路线,依次对树中每个结点均做一次且仅做一次访问。访问结点所做的操作依赖于具体的应用问题。
遍历是二叉树上最重要的运算之一,是二叉树进行其它运算的基础。

根据访问结点操作发生位置命名:

1. NLR:前序遍历(Preorder Traversal 亦称先序遍历)——访问根结点的操作发生在遍历其左右子树之前。
2. LNR:中序遍历(Inorder Traversal)——访问根结点的操作发生在遍历其左右子树之中。
3. LRN:后序遍历(Postorder Traversal)——访问根结点的操作发生在遍历其左右子树之后。

代码表示:

1.前序遍历

void BinaryTreePrevOrder(BTNode* root)
{	
	if (root)	
	{		
		printf("%c ", root->_data);
		// putchar(root->_data); 		
		BinaryTreePrevOrder(root->_left);		
		BinaryTreePrevOrder(root->_right);
	}
}	// 二叉树前序遍历 

2.中序遍历

void BinaryTreeInOrder(BTNode* root)
{	
	if (root)	
	{		
		BinaryTreeInOrder(root->_left);		
		printf("%c ", root->_data);		
		BinaryTreeInOrder(root->_right);	
	}
}	// 二叉树中序遍历

3.后序遍历

void BinaryTreePostOrder(BTNode* root)
{	
	if (root)	
	{		
		BinaryTreePostOrder(root->_left);		
		BinaryTreePostOrder(root->_right);		
		printf("%c ", root->_data);	
	}
}	// 二叉树后序遍历

4.层序遍历

层序遍历:除了先序遍历、中序遍历、后序遍历外,还可以对二叉树进行层序遍历。设二叉树的根节点所在层数为1,层序遍历就是从所在二叉树的根节点出发,首先访问第一层的树根节点,然后从左到右访问第2层上的节点,接着是第三层的节点,以此类推,自上而下,自左至右逐层访问树的结点的过程就是层序遍历。

4.3.二叉树的基本操作实现(github链接)

二叉树的基本操作

5.二叉树的OJ习题

1.一棵树包含有2019个结点的二叉树,最多包含多少个叶子结点?

思路分析:若要使得二叉树叶子结点最多,则此二叉树必为完全二叉树。
利用完全二叉树的结点公式有:
    1. n = 2019;则 n1 = 0;(若n为偶数则 n = 1)2. n0 = n2 + 1;
    3. n0 + n1 + n2 = 2019;
 综上:n0 = 1010; 

2.输入一棵二叉树,求该树的深度。从根结点到叶结点依次经过的结点(含根、叶结点)形成树的一条路径,最长路径的长度为树的深度。

思路分析:二叉树的最大深度等价于:左右子树的最大深度 + 1 ;(即左右子树加根结点)

代码实现:

int maxDepth(struct TreeNode* root)
{    
	if(root == NULL)        
		return 0;        
	int leftDepth = maxDepth(root->left);    
	int rightDepth = maxDepth(root->right);
	return (leftDepth > rightDepth ? leftDepth : rightDepth) + 1;
}

3.给定一个二叉树,判断它是否是高度平衡的二叉树。本题中,一棵高度平衡二叉树定义为:一个二叉树每个节点 的左右两个子树的高度差的绝对值不超过1。

保证当前树的左右子树高度差不大于1,并且子树本身也是平衡树。 

代码实现:

int maxDepth(struct TreeNode* root)
{    
	if(root == NULL)        
		return 0;
    	int leftDepth = maxDepth(root->left);    
    	int rightDepth = maxDepth(root->right);
    	return (leftDepth > rightDepth ? leftDepth : rightDepth) + 1;
}

bool isBalanced(struct TreeNode* root)
{    
	if(root == NULL)        
		return true;        
	int q1 = maxDepth(root->left);
	int q2 = maxDepth(root->right);
	
	return abs(q1 - q2) <= 1
	&& isBalanced(root->left)
	&& isBalanced(root->right);
}

4.请实现一个函数,用来判断一颗二叉树是不是对称的。注意,如果一个二叉树同此二叉树的镜像是同样的,定义其为对称的。

思路分析:首先要判断左右孩子是否对称相等,还需要判断结点左孩子的左子树是否和右孩子的
右子树对称,左孩子的右子树是否和右孩子的左子树对称。 

代码实现:

bool _isSymmetric(struct TreeNode* left, struct TreeNode* right)
{    
	if(left == NULL && right == NULL)            
		return true;
		
	if(left == NULL || right == NULL)        
		return false;
		
        return left->val == right->val        
        && _isSymmetric(left->left, right->right)        
        && _isSymmetric(left->right, right->left)}

bool isSymmetric(struct TreeNode* root)
{    
	if(root == NULL)        
	return true;        
	return _isSymmetric(root->left, root->right);
}

二叉树的相关OJ习题及解答(github链接)
二叉树相关OJ习题及解答

;