系列文章目录

  1. Python序列之列表
  2. Python序列之元组
  3. Python序列之字典
  4. Python序列之集合(本篇文章)

Python序列之集合

  • 系列文章目录
  • 前言
  • 一、集合是什么?
  • 二、集合的操作
    • 1.集合的创建
      • (1)使用`{}`创建
      • (2)使用`set()`函数创建
    • 2.集合元素的添加
      • (1)使用`add()`添加单个元素
      • (2)使用`update()`批量添加元素
    • 3.集合元素的删除
      • (1)使用`remove()`删除指定元素
      • (2)使用`discard()`删除指定元素
      • (3)使用`clear()`清空整个集合
      • (4)使用`pop()`随机弹出一个元素
    • 4.使用集合去重(重要应用)
    • 5.集合的数学运算
      • (1)交集
      • (2)并集
      • (3)差集(补集)
      • (4)对称差集
      • (5)判断是否为子集、母集
  • 总结

前言

前面我们已经讲了Python中的列表:Python序列之列表、元组:Python序列之元组和字典:Python序列之字典。今天我们再来看一下Python中另一种序列——集合。

集合这个词大家肯定不陌生,高中数学必修一第一章,便是集合。你应该还记得数学老师说过:“集合具有三个性质:确定性、互异性、无序性”,Python中的集合set便是借鉴了数学中的这种“数据结构”。同样满足这三个性质。

不仅如此,Python还提供的数学中集合的各种运算:求并集、求交集、求补集……

一、集合是什么?

集合是无序可变的,元素不能重复,故经常用集合来实现数据去重。实际上,集合底层是字典实现,集合的所有元素都是字典中的”键对象”,因此是不能重复的且唯一的。

二、集合的操作

1.集合的创建

(1)使用{}创建

a = {3, 5, 7}b = {}# 创建一个空集合c = {3}# 只有一个元素的集合print(a)# 输出:{3, 5, 7}print(b)# 输出:{}print(c)# 输出:{3}

(2)使用set()函数创建

a = ['a', 2, True]b = set(a)c = set()# 创建一个空集合print(b)# 输出:{True, 'a', 2}print(c)# 输出:set()print(type(b))# 输出:print(type(c))# 输出:

由上面的两个例子可知,Python对空集合的打印表示有两种:{}set()

2.集合元素的添加

(1)使用add()添加单个元素

a = {10, 20, 30}a.add('a')print(a)# 输出:{10, 'a', 20, 30}

(2)使用update()批量添加元素

a = {10, 20, 30}b = [True, False, 999]a.update(b)print(a)# 输出:{False, True, 999, 10, 20, 30}

3.集合元素的删除

(1)使用remove()删除指定元素

a = {10, 20, 30, 40, 50}a.remove(30)print(a)# 输出:{50, 20, 40, 10}a.remove(999)# 报错:KeyError: 999

可以发现,当试图用remove()移除一个集合中并不存在的元素时,解释器会报错。这种反应过于暴力,因此有了更加温柔且绅士的删除方法——discard()

(2)使用discard()删除指定元素

a = {10, 20, 30, 40, 50}a.remove(30)print(a)# 输出:{50, 20, 40, 10}a.discard(999)# 无报错print(a)# 输出:{50, 20, 40, 10}

当试图删除一个集合中并不存在的元素时,discard()并不会报错,而是什么都不干,程序照常往下运行,优雅且绅士~

(3)使用clear()清空整个集合

a = {10, 20, 30, 40, 50}a.clear()print(a)# 输出:set()

(4)使用pop()随机弹出一个元素

a = {10, 20, 30, 40, 50}b = a.pop()print(b)# 输出:50print(a)# 输出:{20, 40, 10, 30}

4.使用集合去重(重要应用)

我们可以充分利用集合的互异性来实现列表元素的去重:

a = [1, 1, 5, 6, 6, 8, 9, 8, 6]b = set(a)print(b)# 输出:{1, 5, 6, 8, 9}

5.集合的数学运算

像数学中概念一样,Python对集合也提供了并集、交集、差集等运算。

(1)交集

下面展式了三种取交集的方法:

a = {1, 2, 3, 4}b = {2, 3, 99, 100, 'yyy'}c = a & b# 方法一:&print(c)# 输出:{2, 3}d = a.intersection(b)# 方法二:取交集并返回一个新集合print(d)# 输出:{2, 3}print(a)# 输出:{1, 2, 3, 4}a.intersection_update(b)# 方法三:取交集并更新原集合print(a)# 输出:{2, 3}

(2)并集


下面展式了两种取并集的方法:

a = {1, 2, 3, 4}b = {2, 3, 99, 100, 'yyy'}c = a | b# 方法一:|print(c)# 输出:{1, 2, 3, 4, 99, 100, 'yyy'}d = a.union(b)# 方法二:union()print(d)# 输出:{1, 2, 3, 4, 99, 100, 'yyy'}

(3)差集(补集)

下面展式了三种取差集的方法:

a = {1, 2, 3, 4}b = {2, 3, 99, 100, 'yyy'}c = a - b# 方法一:-print(c)# 输出:{1, 4}d = a.difference(b)# 方法二:取交集并返回一个新集合print(d)# 输出:{1, 4}print(a)# 输出:{1, 2, 3, 4}a.difference_update(b)# 方法三:取交集并更新原集合print(a)# 输出:{1, 4}

注意:差集是有方向性的,A-B ≠ B-A

(4)对称差集

python集合set内置方法symmetric_differece(),可以用来返回两个集合(或调用对象集合与其它可迭代对象iterable)中非共同的元素组成的新集合set。

a = {1, 2, 3, 4}b = {2, 3, 99, 100, 'yyy'}c = a ^ b# 方法一:^print(c)# 输出:{1, 99, 100, 'yyy', 4}d = a.symmetric_difference(b)# 方法二:取对称差并返回一个新集合print(d)# 输出:{1, 99, 100, 4, 'yyy'}print(a)# 输出:{1, 2, 3, 4}a.symmetric_difference_update(b)# 方法三:取对称差并更新原集合print(a)# 输出:{1, 99, 100, 4, 'yyy'}

(5)判断是否为子集、母集

方法用途
a.issubset(b)判断a是否为b的子集
a.issuperset(b)判断a是否为b的母集
a.isdisjoint(b)判断ab的交集是否为空集
a = {1, 2, 3}b = {1, 2, 3, 4, 5}c = {1, 2, 'yyy'}d = {'a', 'b', 'c'}print(a.issubset(b))# 输出:Trueprint(a.issubset(c))# 输出:Falseprint(b.issuperset(a))# 输出:Trueprint(a.isdisjoint(c))# 输出:Falseprint(a.isdisjoint(d))# 输出:True

总结

Python中的集合可以认为是数学中集合的具体实现,具有数学集合的三个性质,不仅可以进行增删改查,还可以进行数学中的集合运算。