数据结构--八大排序算法

1. 直接插入排序

当插入第 i(i>=1) 个元素时，前面的 array[0],array[1],…,array[i-1] 已经排好序，此用 array[i] 的排序码与 array[i-1],array[i-2],… 的排序码顺序进行比较，找到插入位置即将 array[i] 插入，原来位置上的元素顺序后移。

void Swap(int* x, int* y)
{
	int tmp = *x;
	*x = *y;
	*y = tmp;
}

// 直接插入排序--时间复杂度略小于O(n^2)
// 希尔排序 gap == 1 就是直接插入排序
void InsertSort(int* arr, int n)
{
	for (int i = 0; i < n - 1; ++i)
	{
		int end = i;
		int tmp = arr[end + 1];
		while (end >= 0)
		{
			// 排升序--大的往后放
			if (arr[end] > tmp)
			{
				arr[end + 1] = arr[end];
				--end;
			}
			else
			{
				break;
			}
		}
		arr[end + 1] = tmp;
	}
}

直接插入排序的特性总结

1. 元素集合越接近有序，直接插入排序算法的时间效率越高；

2. 时间复杂度：O(N^2)；

3. 空间复杂度：O(1)；

2. 希尔排序

希尔排序法又称缩小增量法。希尔排序法的基本思想是：先选定⼀个整数（通常是 gap = n/3 + 1），把待排序文件所有记录分成各组，所有的距离相等的记录分在同⼀组内，并对每一组内的记录进行排序，然后 gap = gap/3 + 1 得到下一个整数，再将数组分成各组，进行插入排序，当 gap = 1 时，就相当于直接插入排序。

它是在直接插入排序算法的基础上进行改进而来的，综合来说它的效率肯定是要高于直接插入排序算法的。

void Swap(int* x, int* y)
{
	int tmp = *x;
	*x = *y;
	*y = tmp;
}

// 希尔排序--O(n^1.3)
void ShellSort(int* arr, int n)
{
	int gap = n;
	while (gap > 1)
	{
		gap = gap / 3 + 1;
		for (int i = 0; i < n - gap; ++i)
		{
			int end = i;
			int tmp = arr[end + gap];
			while (end >= 0)
			{
				if (arr[end] > tmp)
				{
					arr[end + gap] = arr[end];
					end -= gap;
				}
				else
				{
					break;
				}
			}
			arr[end + gap] = tmp;
		}
	}
}

希尔排序的特性总结

1. 希尔排序是对直接插入排序的优化；

2. 当 gap > 1 时都是预排序，目的是让数组更接近于有序。当 gap == 1 时，数组已经接近有序的了，这样就会很快。这样整体而言，可以达到优化的效果；

3. 时间复杂度大约是O(n^1.3)；

3. 直接选择排序

1. 在元素集合 array[i]~array[n-1] 中选择关键码最大(小)的数据元素；

2. 若它不是这组元素中的最后一个(第一个)元素，则将它与这组元素中的最后⼀个（第⼀个）元素

交换；

3. 在剩余的 array[i]~array[n-2]（array[i+1]~array[n-1]）集合中，重复上述步骤，直到集合剩余 1 个元素；

// 直接选择排序--O(n^2)
void SelectSort(int* arr, int n)
{
	int begin = 0, end = n - 1;
	while (begin < end)
	{
		int mini = begin, maxi = begin;
		for (int i = begin; i <= end; ++i)
		{
			if (arr[i] < arr[mini])
			{
				mini = i;
			}
			if (arr[i] > arr[maxi])
			{
				maxi = i;
			}
		}
		// mini == begin 和 maxi == end情况
		if (maxi == begin)
		{
			maxi = mini;
		}
		Swap(&arr[mini], &arr[begin]);
		Swap(&arr[maxi], &arr[end]);

		++begin;
		--end;
	}
}

4. 堆排序

堆排序(Heapsort)是指利用堆积树（堆）这种数据结构所设计的⼀种排序算法，它是选择排序的⼀种。它是通过堆来进行选择数据。需要注意的是排升序要建大堆，排降序建小堆。

void Swap(int* x, int* y)
{
	int tmp = *x;
	*x = *y;
	*y = tmp;
}

// 向下调整
void AdjustDown(int* arr, int parent, int n)
{
	int child = parent * 2 + 1;
	while (child < n)
	{
		// 先找最大的孩子--排升序--建大堆
		if (child + 1 < n && arr[child + 1] > arr[child])
		{
			++child;
		}
		if (arr[child] > arr[parent])
		{
			Swap(&arr[child], &arr[parent]);
			parent = child;
			child = parent * 2 + 1;
		}
		else
		{
			break;
		}
	}
}

// 堆排序--O(nlogn)
void HeapSort(int* arr, int n)
{
	// 向下调整
	for (int i = (n - 1 - 1) / 2; i >= 0; --i)	// O(n)
	{
		AdjustDown(arr, i, n);	// O(logn)
	}

	// 排升序--建大堆
	int end = n - 1;
	while (end > 0)
	{
		Swap(&arr[0], &arr[end]);
		AdjustDown(arr, 0, end);
		--end;
	}
}

5. 冒泡排序

冒泡排序是⼀种最基础的交换排序，之所以叫做冒泡排序，因为每⼀个元素都可以像小气泡一样，根据自身大小一点一点向数组的一侧移动。

void Swap(int* x, int* y)
{
	int tmp = *x;
	*x = *y;
	*y = tmp;
}

// 冒泡排序--O(n^2)
void BubbleSort(int* arr, int n)
{
	for (int i = 0; i < n; ++i)
	{
		int change = 1;
		for (int j = 0; j < n - i - 1; ++j)
		{
			// 排升序--大的往后放
			if (arr[j] > arr[j + 1])
			{
				change = 0;
				Swap(&arr[j], &arr[j + 1]);
			}
		}
		if (change == 1)
			break;
	}
}

6. 快速排序

快速排序是Hoare于1962年提出的⼀种二叉树结构的交换排序方法，其基本思想为：任取待排序元素序列中的某元素作为基准值，按照该排序码将待排序集合分割成两子序列，左子序列中所有元素均小于基准值，右子序列中所有元素均大于基准值，然后最左右子序列重复该过程，直到所有元素都排列在相应位置上为止。

快速排序实现主框架：

// 快速排序
void QuickSort(int* arr, int left, int right)
{
	if (left >= right)
		return;

	// 找基准值
	int key = _QuickSort(arr, left, right);
	// 二分思想--二叉树前序遍历思想
	// [left, key-1] key [key+1, right]
	QuickSort(arr, left, key - 1);
	QuickSort(arr, key + 1, right);
}

将区间中的元素进行划分的 _QuickSort 方法主要有以下几种实现方式：

6.1 hoare版本

算法思路：

1）创建左右指针，确定基准值；

2）从左向右找出比基准值大的数据，从右向左找出比基准值小的数据，左右指针数据交换，进入下次循环；

问题1：为什么跳出循环后right位置的值一定不大于key？

当 left > right 时，即 right 走到 left 的左侧，而 left 扫描过的数据均不大于 key，因此 right 此时指向的数据⼀定不大于key。

问题2：为什么 left 和 right 指定的数据和 key 值相等时也要交换？

相等的值参与交换确实有⼀些额外消耗。实际还有各种复杂的场景，假设数组中的数据大量重复时，无法进行有效的分割排序。

// 左右指针法
int _QuickSort1(int* arr, int left, int right)
{
	int key = left;	// 基准值
	++left;
	while (left <= right)
	{
		// right：从右往左找比基准值要小的数据
		// 比基准值大right就--
		while (left <= right && arr[right] > arr[key])
		{
			--right;
		}
		// left：从左往右找比基准值要大的数据
		// 比基准值小left就++
		while (left <= right && arr[left] < arr[key])
		{
			++left;
		}
		// left和right交换，left、right与基准值相等也要交换
		if (left <= right)
		{
			Swap(&arr[left++], &arr[right--]);
		}
	}
	// 基准值key与right交换
	Swap(&arr[key], &arr[right]);

	// 返回基准值
	return right;
}

6.2 挖坑法

思路：

创建左右指针。首先从右向左找出比基准小的数据，找到后立即放入左边坑中，当前位置变为新的"坑"，然后从左向右找出比基准大的数据，找到后立即放入右边坑中，当前位置变为新的"坑"，结束循环后将最开始存储的分界值放⼊当前的"坑"中，返回当前"坑"下标（即分界值下标）

// 挖坑法
int _QuickSort2(int* arr, int left, int right)
{
	// 起始坑位--left
	int hole = left;
	// 保存起始坑位的内容
	int key = arr[hole];
	//left++;	// err--left这里不能++，++后填坑的位置会有问题

	while (left < right)
	{
		// right：找比坑位的值小
		// 比坑位的值大或者相等就不填坑，且right--
		while (left < right && arr[right] >= key)
		{
			--right;
		}
		arr[hole] = arr[right];	// right下标的值去填坑
		hole = right;	// right下标的位置作为新的坑
		// left：找比坑位的值大
		// 比坑位的值小或者相等就不填坑，且left++
		while (left < right && arr[left] <= key)
		{
			++left;
		}
		arr[hole] = arr[left];	// left下标的值去填坑
		hole = left;	// left下标的位置作为新的坑
	}
	arr[hole] = key;	// 把起始坑位保存的数据去填坑

	return hole;
}

6.3 lomuto前后指针

思路：创建前后指针，从左往右找比基准值小的进行交换，使得小的都排在基准值的左边。

// 双指针法--前后指针法
int _QuickSort3(int* arr, int left, int right)
{
	int prev = left, cur = prev + 1;
	int key = left;
	while (cur <= right)
	{
		if (arr[cur] < arr[key] && ++prev != cur)
		{
			Swap(&arr[cur], &arr[prev]);
		}
		++cur;
	}
	// cur已经越界--key基准值根prev交换
	Swap(&arr[prev], &arr[key]);

	return prev;
}

6.4 非递归版本

借助数据结构栈：数据结构--栈-CSDN博客

// 快排--非递归版本--借助数据结构--栈
void QuickSortNonR(int* arr, int left, int right)
{
	ST st;
	StackInit(&st);
	StackPush(&st, right);
	StackPush(&st, left);
	while (!StackEmpty(&st))
	{
		// 取栈顶元素两次
		int begin = StackTop(&st);
		StackPop(&st);

		int end = StackTop(&st);
		StackPop(&st);

		// 对区间[begin, end]找基准值--双指针法--前后指针
		int prev = begin, cur = prev + 1;
		int key = begin;
		while (cur <= right)
		{
			if (arr[cur] < arr[key] && ++prev != cur)
			{
				Swap(&arr[cur], &arr[prev]);
			}
			++cur;
		}
		// cur已经越界--key基准值根prev交换
		Swap(&arr[prev], &arr[key]);
		key = prev;

		// 此时基准值的下标：key
		// 划分左右序列：[begin, key-1] [key+1, end]
		if (key + 1 < end)	// 右区间
		{
			StackPush(&st, end);
			StackPush(&st, key + 1);
		}
		if (key - 1 > begin)	// 左区间
		{
			StackPush(&st, key - 1);
			StackPush(&st, begin);
		}
	}

	StackDestroy(&st);
}

快速排序特性总结：

1. 时间复杂度：O(nlogn)

2. 空间复杂度：O(logn)

7. 归并排序

归并排序算法思想：

归并排序（MERGE-SORT）是建立在归并操作上的⼀种有效的排序算法,该算法是采用分治法（Divide and Conquer）的⼀个非常典型的应用。将已有序的子序列合并，得到完全有序的序列；即先使每个子序列有序，再使子序列段间有序。若将两个有序表合并成⼀个有序表，称为二路归并。归并排序核心步骤：

7.1 递归版本

// 归并排序子程序
void _MergeSort(int* arr, int left, int right, int* tmp)
{
	if (left >= right)
		return;

	int mid = (left + right) / 2;
	// 根据mid划分成两个序列：[left, mid] [mid+1, right]
	_MergeSort(arr, left, mid, tmp);
	_MergeSort(arr, mid + 1, right, tmp);
	
	// 合并[left, mid] [mid+1， right]
	int begin1 = left, end1 = mid;
	int begin2 = mid + 1, end2 = right;
	int index = begin1;
	while (begin1 <= end1 && begin2 <= end2)
	{
		if (arr[begin1] < arr[begin2])
		{
			tmp[index++] = arr[begin1++];
		}
		else
		{
			tmp[index++] = arr[begin2++];
		}
	}
	// 可能存在第一个序列中的数据没有全部放到tmp中
	while (begin1 <= end1)
	{
		tmp[index++] = arr[begin1++];
	}
	// 可能存在第二个序列中的数据没有全部放到tmp中
	while (begin2 <= end2)
	{
		tmp[index++] = arr[begin2++];
	}

	// 将tmp中数据挪回arr数组中
	for (int i = left; i <= right; ++i)
	{
		arr[i] = tmp[i];
	}
}

// 归并排序--O(nlogn)
void MergeSort(int* a, int n)
{
	int* tmp = (int*)malloc(sizeof(int) * n);
	if (tmp == NULL)
	{
		perror("malloc fail!\n");
		exit(-1);
	}
	_MergeSort(a, 0, n - 1, tmp);
	free(tmp);
}

7.2 非递归版本

// 归并排序--非递归版本
void MergeSortNonR(int* arr, int n)
{
	int* tmp = (int*)malloc(sizeof(int) * n);
	if (tmp == NULL)
	{
		perror("malloc fail!\n");
		exit(-1);
	}
	int gap = 1;
	while (gap < n)
	{
		// 根据gap划分组，两两一合并
		for (int i = 0; i < n; i += 2 * gap)
		{
			// [i, i+gap-1] [i+gap, i+2*gap-1]
			int begin1 = i, end1 = i + gap - 1;
			int begin2 = i + gap, end2 = i + 2 * gap - 1;

			// 第二组都越界不存在，这一组就不需要归并
			if (begin2 >= n)
			{
				break;
			}

			// 第二的组begin2没越界，end2越界了，需要修正一下，继续归并
			if (end2 >= n)
			{
				end2 = n - 1;
			}

			int index = begin1;
			// 两个有序序列进行合并
			while (begin1 <= end1 && begin2 <= end2)
			{
				if (arr[begin1] < arr[begin2])
				{
					tmp[index++] = arr[begin1++];
				}
				else
				{
					tmp[index++] = arr[begin2++];
				}
			}
			
			// 第一组还有数据
			while (begin1 <= end1)
			{
				tmp[index++] = arr[begin1++];
			}

			// 第二组还有数据
			while (begin2 <= end2)
			{
				tmp[index++] = arr[begin2++];
			}

			// 导入到原数组中
			memcpy(arr + i, tmp + i, sizeof(int) * (end2 - i + 1));
		}
		gap *= 2;
	}
	free(tmp);
	tmp = NULL;
}

归并排序特性总结：

1. 时间复杂度：O(nlogn)

2. 空间复杂度：O(n)

8. 计数排序

计数排序又称为鸽巢原理，是对哈希直接定址法的变形应用。

操作步骤：

1）统计相同元素出现次数；

2）根据统计的结果将序列回收到原来的序列中；

// 计数排序--O(n+range)
void CountSort(int* arr, int n)
{
	int min = arr[0], max = arr[0];
	for (int i = 1; i < n; ++i)
	{
		// 找最大值
		if (arr[i] > max)
		{
			max = arr[i];
		}
		// 找最小值
		if (arr[i] < min)
		{
			min = arr[i];
		}
	}

	// max min
	int range = max - min + 1;
	int* count = (int*)calloc(range, sizeof(int));
	if (count == NULL)
	{
		perror("calloc fail!\n");
		exit(-1);
	}

	for (int i = 0; i < n; ++i)
	{
		count[arr[i] - min]++;
	}

	// 将count中出现的次数还原到原数组中
	int index = 0;
	for (int i = 0; i < range; ++i)
	{
		while (count[i]--)
		{
			arr[index++] = i + min;
		}
	}
}

完