草根学Python(七) 迭代器和生成器
2017-07-02 23:27
330 查看
前言
这篇博客写了很久,其实写每一篇博客用的时间还是挺长的,不够这有利于自己的学习,也想分享一下。之前也说了创建了一个微信群,Python 学习讨论群,现在只有 40 个左右的小伙伴,如果有兴趣加入学习讨论的话,可以加我微信:androidwed,拉你进群。想看回之前的文章,也可以通过 Gitbook 查看,欢迎提出问题和点下 star,及时查看更新。
目录
一、迭代
什么叫做迭代?比如在 Java 中,我们通过 List 集合的下标来遍历 List 集合中的元素,在 Python 中,给定一个 list 或 tuple,我们可以通过 for 循环来遍历这个 list 或 tuple ,这种遍历就是迭代。
可是,Python 的
for循环抽象程度要高于 Java 的
for循环的,为什么这么说呢?因为 Python 的
for循环不仅可以用在 list 或tuple 上,还可以作用在其他可迭代对象上。也就是说,只要是可迭代的对象,无论有没有下标,都是可以迭代的。
比如:
# -*- coding: UTF-8 -*- # 1、for 循环迭代字符串 for char in 'liangdianshui' : print ( char , end = ' ' ) print('\n') # 2、for 循环迭代 list list1 = [1,2,3,4,5] for num1 in list1 : print ( num1 , end = ' ' ) print('\n') # 3、for 循环也可以迭代 dict (字典) dict1 = {'name':'两点水','age':'23','sex':'男'} for key in dict1 : # 迭代 dict 中的 key print ( key , end = ' ' ) print('\n') for value in dict1.values() : # 迭代 dict 中的 value print ( value , end = ' ' ) print ('\n') # 如果 list 里面一个元素有两个变量,也是很容易迭代的 for x , y in [ (1,'a') , (2,'b') , (3,'c') ] : print ( x , y )
输出的结果如下:
l i a n g d i a n s h u i 1 2 3 4 5 name age sex 两点水 23 男 1 a 2 b 3 c
二、Python 迭代器
上面简单的介绍了一下迭代,迭代是 Python 最强大的功能之一,是访问集合元素的一种方式。现在正式进入主题:迭代器,迭代器是一个可以记住遍历的位置的对象。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。
迭代器只能往前不会后退。
迭代器有两个基本的方法:iter() 和 next(),且字符串,列表或元组对象都可用于创建迭代器,迭代器对象可以使用常规 for 语句进行遍历,也可以使用 next() 函数来遍历。
具体的实例:
# 1、字符创创建迭代器对象 str1 = 'liangdianshui' iter1 = iter ( str1 ) # 2、list对象创建迭代器 list1 = [1,2,3,4] iter2 = iter ( list1 ) # 3、tuple(元祖) 对象创建迭代器 tuple1 = ( 1,2,3,4 ) iter3 = iter ( tuple1 ) # for 循环遍历迭代器对象 for x in iter1 : print ( x , end = ' ' ) print('\n------------------------') # next() 函数遍历迭代器 while True : try : print ( next ( iter3 ) ) except StopIteration : break
最后输出的结果:
l i a n g d i a n s h u i ------------------------ 1 2 3 4
三、lsit 生成式(列表生成式)
1、创建 list 的方式
之前经过我们的学习,都知道如何创建一个 list ,可是有些情况,用赋值的形式创建一个 list 太麻烦了,特别是有规律的 list ,一个一个的写,一个一个赋值,太麻烦了。比如要生成一个有 30 个元素的 list ,里面的元素为 1 - 30 。我们可以这样写:# -*- coding: UTF-8 -*- list1=list ( range (1,31) ) print(list1)
输出的结果:
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30]
这个其实在之前也有提到过:比如有个例子,打印九九乘法表,用这个方法其实就几句代码就可以了,具体可以看之前的这个章节:条件语句和循环语句综合实例
但是,如果用到 list 生成式,可以一句代码就生成九九乘法表了。具体看代码:
print('\n'.join([' '.join ('%dx%d=%2d' % (x,y,x*y) for x in range(1,y+1)) for y in range(1,10)]))
最后输出的结果:
1x1= 1 1x2= 2 2x2= 4 1x3= 3 2x3= 6 3x3= 9 1x4= 4 2x4= 8 3x4=12 4x4=16 1x5= 5 2x5=10 3x5=15 4x5=20 5x5=25 1x6= 6 2x6=12 3x6=18 4x6=24 5x6=30 6x6=36 1x7= 7 2x7=14 3x7=21 4x7=28 5x7=35 6x7=42 7x7=49 1x8= 8 2x8=16 3x8=24 4x8=32 5x8=40 6x8=48 7x8=56 8x8=64 1x9= 9 2x9=18 3x9=27 4x9=36 5x9=45 6x9=54 7x9=63 8x9=72 9x9=81
不过,这里我们先要了解如何创建 list 生成式
2、list 生成式的创建
首先,lsit 生成式的语法为:[expr for iter_var in iterable] [expr for iter_var in iterable if cond_expr]
第一种语法:首先迭代 iterable 里所有内容,每一次迭代,都把 iterable 里相应内容放到iter_var 中,再在表达式中应用该 iter_var 的内容,最后用表达式的计算值生成一个列表。
第二种语法:加入了判断语句,只有满足条件的内容才把 iterable 里相应内容放到 iter_var 中,再在表达式中应用该 iter_var 的内容,最后用表达式的计算值生成一个列表。
其实不难理解的,因为是 list 生成式,因此肯定是用 [] 括起来的,然后里面的语句是把要生成的元素放在前面,后面加 for 循环语句或者 for 循环语句和判断语句。
例子:
# -*- coding: UTF-8 -*- lsit1=[x * x for x in range(1, 11)] print(lsit1)
输出的结果:
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
可以看到,就是把要生成的元素 x * x 放到前面,后面跟 for 循环,就可以把 list 创建出来。那么 for 循环后面有 if 的形式呢?又该如何理解:
# -*- coding: UTF-8 -*- lsit1= [x * x for x in range(1, 11) if x % 2 == 0] print(lsit1)
输出的结果:
[4, 16, 36, 64, 100]
这个例子是为了求 1 到 10 中偶数的平方根,上面也说到,
x * x是要生成的元素,后面那部分其实就是在 for 循环中嵌套了一个 if 判断语句。
那么有了这个知识点,我们也可以猜想出,for 循环里面也嵌套 for 循环。具体示例:
# -*- coding: UTF-8 -*- lsit1= [(x+1,y+1) for x in range(3) for y in range(5)] print(lsit1)
输出的结果:
[(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (3, 1), (3, 2), (3, 3), (3, 4), (3, 5)]
其实知道了 list 生成式是怎样组合的,就不难理解这个东西了。因为 list 生成式只是把之前学习的知识点进行了组合,换成了一种更简洁的写法而已。
四、生成器
1、为什么需要生成器
通过上面的学习,可以知道列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含 1000 万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的 list,从而节省大量的空间。在 Python 中,这种一边循环一边计算的机制,称为生成器:generator。
在 Python 中,使用了 yield 的函数被称为生成器(generator)。
跟普通函数不同的是,生成器是一个返回迭代器的函数,只能用于迭代操作,更简单点理解生成器就是一个迭代器。
在调用生成器运行的过程中,每次遇到 yield 时函数会暂停并保存当前所有的运行信息,返回yield的值。并在下一次执行 next()方法时从当前位置继续运行。
那么如何创建一个生成器呢?
2、生成器的创建
最简单最简单的方法就是把一个列表生成式的[]改成
()
# -*- coding: UTF-8 -*- gen= (x * x for x in range(10)) print(gen)
输出的结果:
<generator object <genexpr> at 0x0000000002734A40>
创建 List 和 generator 的区别仅在于最外层的
[]和
()。但是生成器并不真正创建数字列表, 而是返回一个生成器,这个生成器在每次计算出一个条目后,把这个条目“产生” ( yield ) 出来。 生成器表达式使用了“惰性计算” ( lazy evaluation,也有翻译为“延迟求值”,我以为这种按需调用 call by need 的方式翻译为惰性更好一些),只有在检索时才被赋值( evaluated ),所以在列表比较长的情况下使用内存上更有效。
那么竟然知道了如何创建一个生成器,那么怎么查看里面的元素呢?
3、遍历生成器的元素
按我们的思维,遍历用 for 循环,对了,我们可以试试:# -*- coding: UTF-8 -*- gen= (x * x for x in range(10)) for num in gen : print(num)
没错,直接这样就可以遍历出来了。当然,上面也提到了迭代器,那么用 next() 可以遍历吗?当然也是可以的。
4、以函数的形式实现生成器
上面也提到,创建生成器最简单最简单的方法就是把一个列表生成式的[]改成
()。为啥突然来个以函数的形式来创建呢?
其实生成器也是一种迭代器,但是你只能对其迭代一次。这是因为它们并没有把所有的值存在内存中,而是在运行时生成值。你通过遍历来使用它们,要么用一个“for”循环,要么将它们传递给任意可以进行迭代的函数和结构。而且实际运用中,大多数的生成器都是通过函数来实现的。那么我们该如何通过函数来创建呢?
先不急,来看下这个例子:
# -*- coding: UTF-8 -*- def my_function(): for i in range(10): print ( i ) my_function()
输出的结果:
0 1 2 3 4 5 6 7 8 9
如果我们需要把它变成生成器,我们只需要把
print ( i )改为
yield i就可以了,具体看下修改后的例子:
# -*- coding: UTF-8 -*- def my_function(): for i in range(10): yield i print(my_function())
输出的结果:
<generator object my_function at 0x0000000002534A40>
但是,这个例子非常不适合使用生成器,发挥不出生成器的特点,生成器的最好的应用应该是:你不想同一时间将所有计算出来的大量结果集分配到内存当中,特别是结果集里还包含循环。因为这样会耗很大的资源。
比如下面是一个计算斐波那契数列的生成器:
# -*- coding: UTF-8 -*- def fibon(n): a = b = 1 for i in range(n): yield a a, b = b, a + b # 引用函数 for x in fibon(1000000): print(x , end = ' ')
运行的效果:
你看,运行一个这么打的参数,也不会说有卡死的状态,因为这种方式不会使用太大的资源。这里,最难理解的就是 generator 和函数的执行流程不一样。函数是顺序执行,遇到 return 语句或者最后一行函数语句就返回。而变成 generator 的函数,在每次调用 next() 的时候执行,遇到 yield语句返回,再次执行时从上次返回的 yield 语句处继续执行。
比如这个例子:
# -*- coding: UTF-8 -*- def odd(): print ( 'step 1' ) yield ( 1 ) print ( 'step 2' ) yield ( 3 ) print ( 'step 3' ) yield ( 5 ) o = odd() print( next( o ) ) print( next( o ) ) print( next( o ) )
输出的结果:
step 1 1 step 2 3 step 3 5
可以看到,odd 不是普通函数,而是 generator,在执行过程中,遇到 yield 就中断,下次又继续执行。执行 3 次 yield 后,已经没有 yield 可以执行了,如果你继续打印
print( next( o ) ),就会报错的。所以通常在 generator 函数中都要对错误进行捕获。
5、打印杨辉三角
通过学习了生成器,我们可以直接利用生成器的知识点来打印杨辉三角:# -*- coding: UTF-8 -*- def triangles( n ): # 杨辉三角形 L = [1] while True: yield L L.append(0) L = [ L [ i -1 ] + L [ i ] for i in range (len(L))] n= 0 for t in triangles( 10 ): # 直接修改函数名即可运行 print(t) n = n + 1 if n == 10: break
输出的结果为:
[1] [1, 1] [1, 2, 1] [1, 3, 3, 1] [1, 4, 6, 4, 1] [1, 5, 10, 10, 5, 1] [1, 6, 15, 20, 15, 6, 1] [1, 7, 21, 35, 35, 21, 7, 1] [1, 8, 28, 56, 70, 56, 28, 8, 1] [1, 9, 36, 84, 126, 126, 84, 36, 9, 1]
五、迭代器和生成器综合例子
因为迭代器和生成器基本是互通的,因此有些知识点需要综合在一起1、反向迭代
反向迭代,应该也是常有的需求了,比如从一开始迭代的例子里,有个输出 list 的元素,从 1 到 5 的list1 = [1,2,3,4,5] for num1 in list1 : print ( num1 , end = ' ' )
那么我们从 5 到 1 呢?这也很简单, Python 中有内置的函数
reversed()
list1 = [1,2,3,4,5] for num1 in reversed(list1) : print ( num1 , end = ' ' )
方向迭代很简单,可是要注意一点就是:反向迭代仅仅当对象的大小可预先确定或者对象实现了
__reversed__()的特殊方法时才能生效。 如果两者都不符合,那你必须先将对象转换为一个列表才行
其实很多时候我们可以通过在自定义类上实现
__reversed__()方法来实现反向迭代。不过有些知识点在之前的篇节中还没有提到,不过可以相应的看下,有编程基础的,学完上面的知识点应该也能理解的。
# -*- coding: UTF-8 -*- class Countdown: def __init__(self, start): self.start = start def __iter__(self): # Forward iterator n = self.start while n > 0: yield n n -= 1 def __reversed__(self): # Reverse iterator n = 1 while n <= self.start: yield n n += 1 for rr in reversed(Countdown(30)): print(rr) for rr in Countdown(30): print(rr)
输出的结果是 1 到 30 然后 30 到 1 ,分别是顺序打印和倒序打印
2、同时迭代多个序列
你想同时迭代多个序列,每次分别从一个序列中取一个元素。你遇到过这样的需求吗?为了同时迭代多个序列,使用 zip() 函数,具体示例:
# -*- coding: UTF-8 -*- names = ['laingdianshui', 'twowater', '两点水'] ages = [18, 19, 20] for name, age in zip(names, ages): print(name,age)
输出的结果:
laingdianshui 18 twowater 19 两点水 20
其实 zip(a, b) 会生成一个可返回元组 (x, y) 的迭代器,其中 x 来自 a,y 来自 b。 一旦其中某个序列到底结尾,迭代宣告结束。 因此迭代长度跟参数中最短序列长度一致。注意理解这句话喔,也就是说如果 a , b 的长度不一致的话,以最短的为标准,遍历完后就结束。
利用
zip()函数,我们还可把一个 key 列表和一个 value 列表生成一个 dict (字典),如下:
# -*- coding: UTF-8 -*- names = ['laingdianshui', 'twowater', '两点水'] ages = [18, 19, 20] dict1= dict(zip(names,ages)) print(dict1)
输出如下结果:
{'laingdianshui': 18, 'twowater': 19, '两点水': 20}
这里提一下,
zip()是可以接受多于两个的序列的参数,不仅仅是两个。
相关文章推荐
- python中迭代器、列表解析、生成器的分析比较
- Python 生成器函数,生成器表达式,迭代器,列表解析
- Python 生成器与迭代器
- 可爱的 Python: 迭代器和简单生成器
- Python斐波拉契生成器与迭代器
- python中的迭代器与生成器 .
- Python生成器和迭代器的关系
- python 从yield 学习迭代器和生成器
- python中的迭代器与生成器详解
- Python中的新型构造迭代器和简单生成器
- 强大的Python 迭代器和简单生成器
- Python迭代器与生成器(转)
- python中的迭代器与生成器
- Python的迭代器和生成器
- ·python·用生成器和迭代器实现自己的xrange
- ·python·用生成器和迭代器实现自己的xrange
- python·用生成器和迭代器实现自己的xrange
- python学习笔记之八:迭代器和生成器
- python中的迭代器与生成器
- python迭代器和生成器