您的位置:首页 > 编程语言 > Python开发

Python 集合set

2013-12-18 22:26 211 查看
Python中除了有list这种有顺序的高级数据类型,还包括set这种无序不可重复的数据类型。其实dict就是一种set,当dict没有key,只有value时,就是set的标准格式,即set={}.

虽然set不能像list那样进行index,slice等操作,但作为集合,set可以进行集合的交(intersection, &), 并(union, |), 差(difference, -)等操作。

[python] view
plaincopy

>>> set1=set('This is a set') #先将字符串转换成由单个字符组成的list,再从list转换成set

>>> set2=set(['This','is','a','set']) #已经是list,直接转换成set

>>> set1 & set2 #等价于set1.intersection(set2)

{'a'}

>>> set1 | set2 #等价于set1.union(set2)

{'This', 's', 'set', 'T', 'h', 'i', 't', 'is', ' ', 'a', 'e'}

>>> set1 - set2 #等价于set1.difference(set2)

{'s', 't', 'h', 'i', 'T', ' ', 'e'}

>>> set1^set2 #等价于set1.symmetric_difference(set2)或(set1 | set2) - (set1 & set2),两集合的并集减去交集,异或

{'is', 'set', 'T', 'h', 'i', 't', 's', ' ', 'This', 'e'}

>>> set3=set('This')

>>> set3.issubset(set1) #查看set3是否为set1的子集

True

>>> set1.issuperset(set3) #与set3.issubset(set1)等价

True

>>> set3.add('mn') #添加数据,add()只能有一个参数,不能使用list当参数,且会将参数作为整体添加进去,没有中间转换成list的步骤

>>> set3

{'mn', 's', 'h', 'i', 'T'}

>>> set3.clear() #清空

>>> set3.update('mn','34',['56','2',12])#添加多个数据(字符串,不是数字)到set,如果没有显式地使用list([]),则会先将字符串分割成一个个字符,然后所有参数组成一个长得list,再添加进去。实际上update的参数整个是一个set,所有数据变成一个list后,先组成set,再添加。数字必须显式的在list内才能添加。

>>> set3

{'2', '3', 12, '4', 'n', 'm', '56'}

>>> set3.remove('2') #删除一个元素(一次只能删除一个),如果不存在,则会弹出KeyError;与set.discard()类似,只是discard不会弹出错误;set.pop()是弹出某一元素并返回,不能指定弹出哪个元素

>>> set3

{'3', 12, '4', 'n', 'm', '56'}

>>> set4=set3.copy() #与dict一样,set只能用copy复制,不能使用set4=set3或set4=set3[:]

由于set不允许数据重复,所以可以很方便的使用set来去掉数据中的重复数据,对于海量数据非常好用。而且通过len()函数的变化,也可以很方便地看出有多少重复数据。

[python] view
plaincopy

>>> l=list('hello')

>>> l

['h', 'e', 'l', 'l', 'o']

>>> l_s=set(l)

>>> l_s

{'h', 'o', 'l', 'e'}

>>> len(l)-len(l_s)

1

除了set()之外,还有一种frozenset()。不同之处是,set可被改变,frozenset不可被改变,只能进行一些集合操作,如交,并,异或,或者判断某集合是否为另一集合的子集等。set不可被hash,frozenset可以。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: