Bootstrap

【python系列】python数据类型之集合

探索Python集合数据类型

Python 中的集合(set)是一种强大且灵活的数据结构,适用于存储不重复的元素并支持高效的集合操作。本篇文章将从定义、操作到练习题,全面解析 Python 的集合数据类型。


1. 定义

什么是集合?

集合(set)是 Python 内置的数据类型之一,它是一个无序且不重复的元素集合。集合的实现基于哈希表,因此对集合的查找、添加、删除操作都具有很高的效率。

使用场景

  • 去重:将列表或其他可迭代对象中的重复元素移除。
  • 集合操作:如并集、交集、差集,用于比较多个数据集的关系。
  • 快速查找:由于集合基于哈希表,成员测试(in 操作)非常高效。

2. 集合操作

创建集合

集合可以通过两种方式创建:

  1. 使用大括号 {}
    my_set = {1, 2, 3}
    
  2. 使用 set() 函数:
    my_set = set([1, 2, 3, 3])  # 自动去重
    

基本操作

  1. 添加元素:使用 add() 方法。
    my_set.add(4)
    
  2. 删除元素:
  • remove():如果元素不存在会抛出错误。
  • discard():如果元素不存在不会抛出错误。
  • pop():随机移除并返回一个元素。
    my_set.remove(2)
    my_set.discard(10)  # 不会报错
    my_set.pop()  # 移除任意元素
    
  1. 成员测试:使用 in 或 not in。
    if 3 in my_set:
        print("3 在集合中")
    
  2. 清空集合:使用 clear()。
    my_set.clear()
    

集合操作的延伸

Python 集合提供了许多数学意义上的集合操作,以下是常用操作:

  1. 并集:使用 | 或 union()。
    set1 = {1, 2, 3}
    set2 = {3, 4, 5}
    print(set1 | set2)  # {1, 2, 3, 4, 5}
    print(set1.union(set2))
    
  2. 交集:使用 & 或 intersection()。
    print(set1 & set2)  # {3}
    print(set1.intersection(set2))
    
  3. 差集:使用 - 或 difference()。
    print(set1 - set2)  # {1, 2}
    print(set1.difference(set2))
    
  4. 对称差:使用 ^ 或 symmetric_difference()。
    print(set1 ^ set2)  # {1, 2, 4, 5}
    print(set1.symmetric_difference(set2))
    
  5. 子集和超集:
  • 判断一个集合是否是另一个集合的子集:issubset()。
  • 判断一个集合是否是另一个集合的超集:issuperset()。
    set1 = {1, 2}
    set2 = {1, 2, 3}
    print(set1.issubset(set2))  # True
    print(set2.issuperset(set1))  # True
    
  1. 不可变集合:使用 frozenset() 创建不可修改的集合。
    frozen_set = frozenset([1, 2, 3])
    # frozen_set.add(4)  # 会报错
    

3. 总结与练习题

总结

Python 集合是一种高效、灵活的数据类型,适合处理需要去重、快速查找以及集合运算的场景。它不仅简化了常见的数据处理操作,还提供了丰富的数学集合操作,方便开发者轻松解决问题。

练习题

  1. 创建一个集合,初始化为 {1, 2, 3, 4, 5},然后:

    • 添加元素 6。
    • 移除元素 2。
    • 计算集合与 {4, 5, 6, 7} 的并集、交集和差集。
  2. 给定两个列表 [1, 2, 3, 4, 4] 和 [3, 4, 5, 6]:

    • 将它们分别转换为集合。
    • 找出两个集合的交集和对称差。
  3. 编写一个函数,接收一个字符串并返回该字符串的所有唯一字符(不区分大小写)。

    def unique_chars(s):
        pass
    
;