Bootstrap

利用Python实现Union-Find算法

Union-Find(又称 并查集)是一种高效解决 动态连通性问题 的算法。它主要提供两种操作:

  1. Union(x, y):将元素 xy 连接。
  2. Find(x):找到元素 x 所属的集合的标识符(通常是集合的根节点)。

常用的优化策略:

  • 路径压缩(Path Compression):Find 操作中,将访问的节点直接连接到根节点,从而加速后续操作。
  • 按秩合并(Union by Rank):Union 操作中,总是将较小的树合并到较大的树中,以减少树的高度。

在这里插入图片描述

1、问题背景

Union-Find 算法又称不交并集算法,是一种用于维护一组元素之间不相交集合的算法。在实际应用中,Union-Find 算法可以用来解决多种问题,例如判断两个元素是否属于同一个集合、将两个集合合并为一个集合等。

在 Union-Find 算法中,每个元素都由一个父节点表示,父节点指向该元素所属的集合的根节点。如果两个元素的父节点相同,则这两个元素属于同一个集合。如果两个元素的父节点不同,则这两个元素不属于同一个集合。

2、解决方案

Python 中 Union-Find 算法有两种实现方法:使用数组和使用字典。

使用数组实现 Union-Find 算法时,每个元素的父节点存储在一个数组中。如果两个元素的父节点相同,则这两个元素属于同一个集合。否则,这两个元素不属于同一个集合。

使用字典实现 Union-Find 算法时,每个元素的父节点存储在一个字典中。字典的键是元素,字典的值是该元素的父节点。如果两个元素的父节点相同,则这两个元素属于同一个集合。否则,这两个元素不属于同一个集合。

下面是使用 Python 实现 Union-Find 算法的示例代码:

def union_find_array(lis):
    """
    使用数组实现 Union-Find 算法。

    参数:
        lis: 一组元素。

    返回:
        一个列表,其中每个元素的父节点存储在一个数组中。
    """

    # 创建一个数组,将每个元素的父节点初始化为其自身。
    parents = [i for i in range(len(lis))]

    def find(x):
        """
        查找元素 x 的父节点。

        参数:
            x: 一个元素。

        返回:
            元素 x 的父节点。
        """

        # 如果元素 x 的父节点不是其自身,则继续查找元素 x 的父节点。
        if parents[x] != x:
            parents[x] = find(parents[x])

        # 返回元素 x 的父节点。
        return parents[x]

    def union(x, y):
        """
        将元素 x 和元素 y 所属的集合合并为一个集合。

        参数:
            x: 一个元素。
            y: 一个元素。
        """

        # 查找元素 x 的父节点。
        x_parent = find(x)

        # 查找元素 y 的父节点。
        y_parent = find(y)

        # 如果元素 x 和元素 y 所属的集合不是同一个集合,
        # 则将元素 x 和元素 y 所属的集合合并为一个集合。
        if x_parent != y_parent:
            parents[y_parent] = x_parent

    # 返回父节点数组。
    return parents


def union_find_dict(lis):
    """
    使用字典实现 Union-Find 算法。

    参数:
        lis: 一组元素。

    返回:
        一个字典,其中每个元素的父节点存储在一个字典中。
    """

    # 创建一个字典,将每个元素的父节点初始化为其自身。
    parents = {i: i for i in lis}

    def find(x):
        """
        查找元素 x 的父节点。

        参数:
            x: 一个元素。

        返回:
            元素 x 的父节点。
        """

        # 如果元素 x 的父节点不是其自身,则继续查找元素 x 的父节点。
        if parents[x] != x:
            parents[x] = find(parents[x])

        # 返回元素 x 的父节点。
        return parents[x]

    def union(x, y):
        """
        将元素 x 和元素 y 所属的集合合并为一个集合。

        参数:
            x: 一个元素。
            y: 一个元素。
        """

        # 查找元素 x 的父节点。
        x_parent = find(x)

        # 查找元素 y 的父节点。
        y_parent = find(y)

        # 如果元素 x 和元素 y 所属的集合不是同一个集合,
        # 则将元素 x 和元素 y 所属的集合合并为一个集合。
        if x_parent != y_parent:
            parents[y_parent] = x_parent

    # 返回父节点字典。
    return parents


# 测试代码。
lis = [[1, 2], [2, 3], [4, 5], [6, 7], [1, 7]]
parents_array = union_find_array(lis)
parents_dict = union_find_dict(lis)
print(parents_array)
print(parents_dict)

上述代码中,union_find_array() 函数和 union_find_dict() 函数分别使用数组和字典实现了 Union-Find 算法。find() 函数和 union() 函数分别是 Union-Find 算法中查找元素父节点和将两个集合合并为一个集合的函数。

使用数组实现 Union-Find 算法的代码如下:

def union_find_array(lis):

    # 创建一个数组,将每个元素的父节点初始化为其自身。
    parents = [i for i in range(len(lis))]

    def find(x):

        # 如果元素 x 的父节点不是其自身,则继续查找元素 x 的父节点。
        if parents[x] != x:
            parents[x] = find(parents[x])

        # 返回元素 x 的父节点。
        return parents[x]

    def union(x, y):

        # 查找元素 x 的父节点。
        x_parent = find(x)

        # 查找元素 y 的父节点。
        y_parent = find(y)

        # 如果元素 x 和元素 y 所属的集合不是同一个集合,
        # 则将元素 x 和元素 y 所属的集合合并为一个集合。
        if x_parent != y_parent:
            parents[y_parent] = x_parent

    # 返回父节点数组。
    return parents


# 测试代码。
lis = [[1, 2], [2, 3], [4, 5], [6, 7], [1, 7]]
parents_array = union_find_array(lis)
print(parents_array)

输出结果为:

[2, 2, 2, 6, 2]

使用字典实现 Union-Find 算法的代码如下:

def union_find_dict(lis):

    # 创建一个字典,将每个元素的父节点初始化为其自身。
    parents = {i: i for i in lis}

    def find(x):

        # 如果元素 x 的父节点不是其自身,则继续查找元素 x 的父节点。
        if parents[x] != x:
            parents[x] = find(parents[x])

        # 返回元素 x 的父节点。
        return parents[x]

    def union(x, y):

        # 查找元素 x 的父节点。
        x_parent = find(x)

        # 查找元素 y 的父节点。
        y_parent = find(y)

        # 如果元素 x 和元素 y 所属的集合不是同一个集合,
        # 则将元素 x 和元素 y 所属的集合合并为一个集合。
        if x_parent != y_parent:
            parents[y_parent] = x_parent

    # 返回父节点字典。
    return parents


# 测试代码。
lis = [[1, 2], [2, 3], [4, 5], [6, 7], [1, 7]]
parents_dict = union_find_dict(lis)
print(parents_dict)

输出结果为:

{1: 2, 2: 2, 3: 2, 4: 6, 5: 6, 6: 6, 7: 2}

基本的 Union-Find 非常适合处理动态连通性问题。优化版本结合路径压缩和按秩合并,使其在实际应用中非常高效。可以扩展实现更多功能,如连通性查询、连通分量计数等。

;