您的位置:首页 > 理论基础 > 数据结构算法

Python内置数据结构——集合set ,集合运算

2018-08-18 11:46 543 查看
集合set
去重的,可变的,可迭代的,无序的 元素集合
set的元素必须是可hash的
约定
set翻译为集合

collection 翻译为集合类型,是一个大概念

set定义 初始化
set() -> new empty set object

set(iterable) -> new set object

s1 = set()  #空set
s2 = set(range(5))
s3 = set(list(range(10)))
s4 = {} # 空{}是空字典(dict)不是空set
s5 = {9 ,10, 11} # set
s6 = {(1,2) , 3, 'a'}
s7 = {[1],(1,),1}  # 报错:[1] 是unhashable type: 'list'
set的元素
set 的元素要求必须是可hash的

目前学过的不可hash的类型有list,set,bytearray

元素不可以索引

set 可以迭代

set增加
add(elem) -> None

增加一个元素到set中

如果元素存在,什么都不做(set的去重性质)

update( * others) -> None

合并其他元素到set集合中来

参数others必须是可迭代对象,可以是多个用逗号隔开

就地修改

set删除
remove(elem) -> None

从set中移除一个元素

元素不存在,抛出keyError异常

discard(elem) -> None

从set中移除一个元素

元素不存在什么都不做

pop() -> item

移除并返回任意的元素.(类似随机的)

空集合返回keyError异常

clear()

移除所有元素

set 修改,查询
修改:
要么删除,要么加入新的元素

查询:
非线性结构,无法索引

遍历:
可以迭代所有元素

成员运算符
in 和 not in 判断元素是否在set中

效率为 O(1) ### list,tuple等用成员运算符时,效率为O(n)

set 和线性结构
线性结构的查询时间复杂度是O(n),随着数据规模的增大而增加耗时

set,dict等结构,内部使用hash值作为Key,时间复杂度可以做到O(1),查询时间和数据规模无关

可hash
数值型int,float,complex

布尔型 True,False

字符串 string,bytes

tuple

None

以上都是不可变类型,称为可哈希类型,hashable

集合
基本概念
全集: 所有元素的集合.例如实数集,所有实数组成的集合就是全集

子集subset和超集superset: 一个集合A所有的元素都在另一个集合B内,A是B的子集,B是A的超集

真子集和真超集: A是B的子集,且A不等于B,A就是B的真子集,B是A的真超集

并集: 多个集合合并的解构

交集: 多个集合的公共部分

差集: 集合中除去和其他集合公共部分

集合运算
并集
将两个集合A和B的所有的元素合并到一起,组成的集合称作集合A与集合B的并集
set.union(*others)

返回和多个集合合并后的新的集合
| 运算符重载

等同union
set.update(*others) -> None

和多个集合合并,就地修改
|= -> None

等同update



交集
集合A和B,由所有属于A且属于B的元素组成的集合
set.intersection(* others)

返回和多个集合的交集
&

等同intersection
set.intersection_update(*others) -> None

获取和多个集合的交集,并就地修改
&= -> None

等同intersection_update



差集
集合A和B,由所有属于A且不属于B的元素组成的集合
set.differentce(*others)

返回和多个集合的差集
-

等同difference
set.difference_update(*others)

获取和多个合集的差集并就地修改
-=

等同difference_update(*others)



对称差集
集合A和B,由所有不属于A和B的交集元素组成的集合,基座(A-B)U(B-A)
symmetric_difference(other)

返回和另一个集合的差集
^

等同symmetric_difference(other)
symmetric_difference_update(other)

获取和另一个集合的差集并就地修改
^=

等同symmetric_difference_update



集合判断
set.issubset(other), <=

判断当前集合是否是other的子集
set1 < set2

判断set1 是否是set2 的真子集
set.issuperset(other) >=

判断当前集合是否是other的超集
set1 > set2

判断set1 是否是 set2 的真超集
set.isdisjoint(other)

当前集合和另一个集合没有交集
没有交集,返回True
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  python 内置 数据结构