您的位置:首页 > 编程语言 > Python开发

python--迭代器与生成器

2018-11-08 15:00 337 查看

写在迭代器之前,假如我要循环遍历一个列表并打印,for循环想必是再熟悉不过了

l = [1, 2, 3, 4]
for i in l:
print(i)
1
2
34

然而for循环为什么能循环呢,他的内部是如何实现的呢?

迭代器

迭代
可迭代的(iterable)
迭代顾名思义,一个一个取出来(操作),循环,遍历怎么说都行。
那什么是可迭代的?相信试过字符串,列表,元组,字典,集合都可以被for循环,我们可以用isinstance()来判断是否是可迭代的

from collections import Iterable
print(isinstance('python', Iterable))
print(isinstance([1,2,3], Iterable))
print(isinstance({1:2,2:3}, Iterable))
print(isinstance((1,3,4,5), Iterable))
print(isinstance(100, Iterable))
True
True
True
True
False

事实确实如此,同时结果表明int型是不可迭代的。

迭代器遵循迭代器协议:必须拥有__iter__方法和__next__方法。
那怎么用迭代器迭代呢

l = [1,2,3,4]
res = l.__iter__()
print(res.__next__())   # 从迭代器中取下一个值
print(res.__next__())
print(res.__next__())
1
2
3

__iter__方法返回一个迭代器,可以用__next__方法一个一个的取值,如果值取完了再继续用__next__方法取值则会抛出StopIteration错误异常
而for循环取完停止,这里沿用上面的代码

for i in res:
print(i)
1
2
34

而for循环就是利用了迭代器节省内存的特点来对python当中的变量来进行操作的。

生成器

比如我们从list列表里一个个取值并进行计算,用迭代器是很方便的,但是当列表里头存的元素越来越多时,为了节省内存,我们是否可以在循环的过程中一边循环一边计算呢?这样就不必要再创建完整的list而达到节省内存的效果,这种机制,就称为生成器(generator)

生成器函数
一个函数 带着yield 就是生成器函数
取一个简单的例子:

def func():
print('---->generator')
yield 1

g = func()   # 调用"生成器函数"
print(g)     # g generator(生成器)
<generator object func at 0x000002651C0D4CA8>

调用func()就不会执行这个函数,而是返回一个生成器

def func():
print('python')
yield 1
print('java')
yield 2

g = func()
a = g.__next__()
print(a)
b = g.__next__()
print(b)
python
1
java
2

__next__方法执行生成器函数一直到yield,然后返回yield返回的值,可以直接打印出来。yield关键字的特点: 可以记录当前函数中执行的位置,下一次继续执行
next和yield是一对搭档 : next开始函数的执行 yield停止函数的执行。
生成器函数最大的特点是调用之后不执行,需要next来触发这个函数继续向下执行

生成器的应用:

# 监听文件的输入,对于文件中随时输入的内容进行自动化分析/自动化展示
def get_line():
f = open('file.txt',encoding='utf-8')
while True:
line = f.readline().strip()
if line:
yield line.strip()

line_g = get_line()

for line in line_g:
print(line.split(','))

生成器自带了__iter__方法和__next__方法,所以他的本质就是迭代器
他的优点是惰性运算,要操作多少取多少,节省内存。
一个容易理解的链接:
http://python.jobbole.com/87613/

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: