您的位置:首页 > 编程语言 > Python开发

Python的 循环器 itertools

2016-04-23 00:00 441 查看
循环对象函数对象中,我们了解了循环器(iterator)的功能。循环器是对象的容器,包含有多个对象。通过调用循环器的next()方法 (__next__()方法,在Python 3.x中),循环器将依次返回一个对象。直到所有的对象遍历穷尽,循环器将举出StopIteration错误。

在for i in iterator结构中,循环器每次返回的对象将赋予给i,直到循环结束。使用iter()内置函数,我们可以将诸如表、字典等容器变为循环器。比如
for i in iter([2, 4, 5, 6]):
print(i)

标准库中的itertools包提供了更加灵活的生成循环器的工具。这些工具的输入大都是已有的循环器。另一方面,这些工具完全可以自行使用Python实现,该包只是提供了一种比较标准、高效的实现方式。这也符合Python“只有且最好只有解决方案”的理念。

# import the tools
from itertools import *


无穷循环器

count(5, 2)     #从5开始的整数循环器,每次增加2,即5, 7, 9, 11, 13, 15 ...
cycle('abc')    #重复序列的元素,既a, b, c, a, b, c ...
repeat(1.2)     #重复1.2,构成无穷循环器,即1.2, 1.2, 1.2, ...

repeat也可以有一个次数限制:
repeat(10, 5)   #重复10,共重复5次


函数式工具

函数式编程是将函数本身作为处理对象的编程范式。在Python中,函数也是对象,因此可以轻松的进行一些函数式的处理,比如map(), filter(), reduce()函数。
itertools包含类似的工具。这些函数接收函数作为参数,并将结果返回为一个循环器。
from itertools import *
rlt = imap(pow, [1, 2, 3], [1, 2, 3])
for num in rlt:
print(num)


imap()
map()
的区别在于,
imap()
可以作用于无穷序列,并且,如果两个序列的长度不一致,以短的那个为准。
>>> for x in itertools.imap(lambda x, y: x * y, [10, 20, 30], itertools.count(0)):
...     print x
...
0
40
90


上面显示了imap函数。该函数与map()函数功能相似,只不过返回的不是序列,而是一个循环器。包含元素1, 4, 27,即1**1, 2**2, 3**3的结果。函数pow(内置的乘方函数)作为第一个参数。pow()依次作用于后面两个列表的每个元素,并收集函数结果,组成返回的循环器。
此外,还可以用下面的函数:
starmap(pow, [(1, 1), (2, 2), (3, 3)])
pow将依次作用于表的每个tuple。

ifilter函数与filter()函数类似,只是返回的是一个循环器。

ifilter(lambda x: x > 5, [2, 3, 5, 6, 7]

将lambda函数依次作用于每个元素,如果函数返回True,则收集原来的元素。6, 7
此外,
ifilterfalse(lambda x: x > 5, [2, 3, 5, 6, 7])

与上面类似,但收集返回False的元素。2, 3, 5

takewhile(lambda x: x < 5, [1, 3, 6, 7, 1])
当函数返回假时,不在迭代序列。1, 3

dropwhile(lambda x: x < 5, [1, 3, 6, 7, 1])
当函数返回假时, 开始迭代序列。6, 7, 1

组合工具

我们可以通过组合原有循环器,来获得新的循环器。
chain([1, 2, 3], [4, 5, 7]) # 连接两个循环器成为一个。1, 2, 3, 4, 5, 7
for i in chain(dropwhile(lambda s:s>2,[1,2,3,4,5]),takewhile(lambda s:s>3,[4,5,1,2,3,4,5])):
print i
1
2
3
4
5
4
5


product([1,2], [1, 2]) # 多个循环器集合的笛卡尔积。相当于嵌套循环
>>> for m, n in product([1,2], [1, 2]):
...     print m,n
...
1 1
1 2
2 1
2 2

permutations('abc', 2) # 从'abcd'中挑选两个元素,比如ab, bc, ... 将所有结果排序,返回为新的循环器。
注意,上面的组合分顺序,即ab, ba都返回。
>>> for i in permutations('abc', 2) :
...     print i
...
('a', 'b')
('a', 'c')
('b', 'a')
('b', 'c')
('c', 'a')
('c', 'b')


combinations('abc', 2) # 从'abcd'中挑选两个元素,比如ab, bc, ... 将所有结果排序,返回为新的循环器。

注意,上面的组合不分顺序,即ab, ba的话,只返回一个ab。

>>> for i in combinations('abc', 2) :
...     print i
...
('a', 'b')
('a', 'c')
('b', 'c')

combinations_with_replacement('abc', 2) # 与上面类似,但允许两次选出的元素重复。即多了aa, bb, cc

groupby()

将key函数作用于原循环器的各个元素。根据key函数结果,将拥有相同函数结果的元素分到一个新的循环器。每个新的循环器以函数返回结果为标签。
这就好像一群人的身高作为循环器。我们可以使用这样一个key函数: 如果身高大于180,返回"tall";如果身高底于160,返回"short";中间的返回"middle"。最终,所有身高将分为三个循环器,即"tall", "short", "middle"。

>>> def height_class(h):
...     if h > 180:
...         return "tall"
...     elif h < 160:
...         return "short"
...     else:
...         return "middle"
...
>>> friends = [191, 158, 159, 165, 170, 177, 181, 182, 190]
>>> friends = sorted(friends, key = height_class)
>>> friends
[165, 170, 177, 158, 159, 191, 181, 182, 190]
>>> for m, n in groupby(friends, key = height_class):
...     print(m)
...     print(list(n))
...
middle
[165, 170, 177]
short
[158, 159]
tall
[191, 181, 182, 190]

注意,groupby的功能类似于UNIX中的uniq命令。分组之前需要使用sorted()对原循环器的元素,根据key函数进行排序,让同组元素先在位置上靠拢。

看下面没有排序的错误结果
friends = [191, 158, 159, 165, 170, 177, 181, 182, 190]
>>> for m, n in groupby(friends, key = height_class):
...     print(m)
...     print(list(n))
...
tall
[191]
short
[158, 159]
middle
[165, 170, 177]
tall
[181, 182, 190]


其它工具

compress('ABCD', [1, 1, 1, 0]) # 根据[1, 1, 1, 0]的真假值情况,选择第一个参数'ABCD'中的元素。A, B, C
islice() # 类似于slice()函数,只是返回的是一个循环器
izip() # 类似于zip()函数,只是返回的是一个循环器。

总结

itertools的工具都可以自行实现。itertools只是提供了更加成形的解决方案。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: