Union-Find
(又称 并查集)是一种高效解决 动态连通性问题 的算法。它主要提供两种操作:
Union(x, y)
:将元素x
和y
连接。Find(x)
:找到元素x
所属的集合的标识符(通常是集合的根节点)。
常用的优化策略:
- 路径压缩(Path Compression): 在
Find
操作中,将访问的节点直接连接到根节点,从而加速后续操作。 - 按秩合并(Union by Rank): 在
Union
操作中,总是将较小的树合并到较大的树中,以减少树的高度。
1、问题背景
Union-Find 算法又称不交并集算法,是一种用于维护一组元素之间不相交集合的算法。在实际应用中,Union-Find 算法可以用来解决多种问题,例如判断两个元素是否属于同一个集合、将两个集合合并为一个集合等。
在 Union-Find 算法中,每个元素都由一个父节点表示,父节点指向该元素所属的集合的根节点。如果两个元素的父节点相同,则这两个元素属于同一个集合。如果两个元素的父节点不同,则这两个元素不属于同一个集合。
2、解决方案
Python 中 Union-Find 算法有两种实现方法:使用数组和使用字典。
使用数组实现 Union-Find 算法时,每个元素的父节点存储在一个数组中。如果两个元素的父节点相同,则这两个元素属于同一个集合。否则,这两个元素不属于同一个集合。
使用字典实现 Union-Find 算法时,每个元素的父节点存储在一个字典中。字典的键是元素,字典的值是该元素的父节点。如果两个元素的父节点相同,则这两个元素属于同一个集合。否则,这两个元素不属于同一个集合。
下面是使用 Python 实现 Union-Find 算法的示例代码:
def union_find_array(lis):
"""
使用数组实现 Union-Find 算法。
参数:
lis: 一组元素。
返回:
一个列表,其中每个元素的父节点存储在一个数组中。
"""
# 创建一个数组,将每个元素的父节点初始化为其自身。
parents = [i for i in range(len(lis))]
def find(x):
"""
查找元素 x 的父节点。
参数:
x: 一个元素。
返回:
元素 x 的父节点。
"""
# 如果元素 x 的父节点不是其自身,则继续查找元素 x 的父节点。
if parents[x] != x:
parents[x] = find(parents[x])
# 返回元素 x 的父节点。
return parents[x]
def union(x, y):
"""
将元素 x 和元素 y 所属的集合合并为一个集合。
参数:
x: 一个元素。
y: 一个元素。
"""
# 查找元素 x 的父节点。
x_parent = find(x)
# 查找元素 y 的父节点。
y_parent = find(y)
# 如果元素 x 和元素 y 所属的集合不是同一个集合,
# 则将元素 x 和元素 y 所属的集合合并为一个集合。
if x_parent != y_parent:
parents[y_parent] = x_parent
# 返回父节点数组。
return parents
def union_find_dict(lis):
"""
使用字典实现 Union-Find 算法。
参数:
lis: 一组元素。
返回:
一个字典,其中每个元素的父节点存储在一个字典中。
"""
# 创建一个字典,将每个元素的父节点初始化为其自身。
parents = {i: i for i in lis}
def find(x):
"""
查找元素 x 的父节点。
参数:
x: 一个元素。
返回:
元素 x 的父节点。
"""
# 如果元素 x 的父节点不是其自身,则继续查找元素 x 的父节点。
if parents[x] != x:
parents[x] = find(parents[x])
# 返回元素 x 的父节点。
return parents[x]
def union(x, y):
"""
将元素 x 和元素 y 所属的集合合并为一个集合。
参数:
x: 一个元素。
y: 一个元素。
"""
# 查找元素 x 的父节点。
x_parent = find(x)
# 查找元素 y 的父节点。
y_parent = find(y)
# 如果元素 x 和元素 y 所属的集合不是同一个集合,
# 则将元素 x 和元素 y 所属的集合合并为一个集合。
if x_parent != y_parent:
parents[y_parent] = x_parent
# 返回父节点字典。
return parents
# 测试代码。
lis = [[1, 2], [2, 3], [4, 5], [6, 7], [1, 7]]
parents_array = union_find_array(lis)
parents_dict = union_find_dict(lis)
print(parents_array)
print(parents_dict)
上述代码中,union_find_array() 函数和 union_find_dict() 函数分别使用数组和字典实现了 Union-Find 算法。find() 函数和 union() 函数分别是 Union-Find 算法中查找元素父节点和将两个集合合并为一个集合的函数。
使用数组实现 Union-Find 算法的代码如下:
def union_find_array(lis):
# 创建一个数组,将每个元素的父节点初始化为其自身。
parents = [i for i in range(len(lis))]
def find(x):
# 如果元素 x 的父节点不是其自身,则继续查找元素 x 的父节点。
if parents[x] != x:
parents[x] = find(parents[x])
# 返回元素 x 的父节点。
return parents[x]
def union(x, y):
# 查找元素 x 的父节点。
x_parent = find(x)
# 查找元素 y 的父节点。
y_parent = find(y)
# 如果元素 x 和元素 y 所属的集合不是同一个集合,
# 则将元素 x 和元素 y 所属的集合合并为一个集合。
if x_parent != y_parent:
parents[y_parent] = x_parent
# 返回父节点数组。
return parents
# 测试代码。
lis = [[1, 2], [2, 3], [4, 5], [6, 7], [1, 7]]
parents_array = union_find_array(lis)
print(parents_array)
输出结果为:
[2, 2, 2, 6, 2]
使用字典实现 Union-Find 算法的代码如下:
def union_find_dict(lis):
# 创建一个字典,将每个元素的父节点初始化为其自身。
parents = {i: i for i in lis}
def find(x):
# 如果元素 x 的父节点不是其自身,则继续查找元素 x 的父节点。
if parents[x] != x:
parents[x] = find(parents[x])
# 返回元素 x 的父节点。
return parents[x]
def union(x, y):
# 查找元素 x 的父节点。
x_parent = find(x)
# 查找元素 y 的父节点。
y_parent = find(y)
# 如果元素 x 和元素 y 所属的集合不是同一个集合,
# 则将元素 x 和元素 y 所属的集合合并为一个集合。
if x_parent != y_parent:
parents[y_parent] = x_parent
# 返回父节点字典。
return parents
# 测试代码。
lis = [[1, 2], [2, 3], [4, 5], [6, 7], [1, 7]]
parents_dict = union_find_dict(lis)
print(parents_dict)
输出结果为:
{1: 2, 2: 2, 3: 2, 4: 6, 5: 6, 6: 6, 7: 2}
基本的 Union-Find 非常适合处理动态连通性问题。优化版本结合路径压缩和按秩合并,使其在实际应用中非常高效。可以扩展实现更多功能,如连通性查询、连通分量计数等。