什么是迭代
可以直接作用于for循环的对象统称为可迭代对象(iterable)。
可以被next()函数调用并不断返回下一个值的对象称为迭代器(iterator)。
所有的iterable均可以通过内置函数iter()来转变为iterator。
对迭代器来讲,有一个__next__()就够了。在你使用for 和 in 语句时,程序就会自动调用即将被处理的对象的迭代器对象,然后使用它的__next__()方法,直到监测到一个stopiteration异常。
>>> l = [1,2,3]
>>> [x**2 for x in l]
[1, 4, 9]
>>> next(l)
traceback (most recent call last):
file <stdin>, line 1, in <module>
typeerror: 'list' object is not an iterator
>>> i=iter(l)
>>> next(i)
1
>>> next(i)
2
>>> next(i)
3
>>> next(i)
traceback (most recent call last):
file <stdin>, line 1, in <module>
stopiteration
上面例子中,列表l可以被for进行循环但是不能被内置函数next()用来查找下一个值,所以l是iterable。
l通过iter进行包装后设为i,i可以被next()用来查找下一个值,所以i是iterator。
题外话:
内置函数iter()仅仅是调用了对象的__iter__()方法,所以list对象内部一定存在方法__iter__()
内置函数next()仅仅是调用了对象的__next__()方法,所以list对象内部一定不存在方法__next__(),但是itrator中一定存在这个方法。
for循环内部事实上就是先调用iter()把iterable变成iterator在进行循环迭代的。
>>> l = [4,5,6]
>>> i = l.__iter__()
>>> l.__next__()
traceback (most recent call last):
file <stdin>, line 1, in <module>
attributeerror: 'list' object has no attribute '__next__'
>>> i.__next__()
4
>>> from collections import iterator, iterable
>>> isinstance(l, iterable)
true
>>> isinstance(l, iterator)
false
>>> isinstance(i, iterable)
true
>>> isinstance(i, iterator)
true
>>> [x**2 for x in i]
[25, 36]
iterator继承自iterable,从下面的测试中可以很方便的看到iterator包含__iter__()和__next__()方法,而iteratble仅仅包含__iter__()。
>>> from collections import iterator, iterable
>>> help(iterator)
help on class iterator:
class iterator(iterable)
| method resolution order:
| iterator
| iterable
| builtins.object
|**注解:从这里可以看出iterable继承自object, iterator继承自iterable。
| methods defined here:
|
| __iter__(self)
|
| __next__(self)
| return the next item from the iterator. when exhausted, raise stopiteration
......
>>> help(iterable)
help on class iterable:
class iterable(builtins.object)
| methods defined here:
|
| __iter__(self)
......
iterable需要包含有__iter__()方法用来返回iterator,而iterator需要包含有__next__()方法用来被循环
如果我们自己定义迭代器,只要在类里面定义一个 __iter__() 函数,用它来返回一个带 __next__()方法的对象就够了。
直接上代码
class iterable:
def __iter__(self):
return iterator()
class iterator:
def __init__(self):
self.start=-1
def __next__(self):
self.start +=2
if self.start >10:
raise stopiteration
return self.start
i = iterable()
for i in i: print(i)
上面的代码实现的是找到10以内的奇数,代码中的类名可以随便取,不是一定需要使用我上面提供的类名的。
如果在iterator的__next__方法中没有实现stopiteration异常,那么则是表示的全部奇数,那么需要在调用的时候设置退出循环的条件。
class iterable:
def __iter__(self):
return iterator()
class iterator:
def __init__(self):
self.start=-1
def __next__(self):
self.start +=2
return self.start
i = iterable()
for count, i in zip(range(5),i): #也可以用内置函数enumerate来实现计数工作。
print(i)
我们通过range来实现打印多少个元素,这里表示打印5个元素,返回结果和上面一致。
当然,我们可以把这两个类合并在一起,这样实现程序的简练。
最终版本如下
class iterable:
def __iter__(self):
return self
def __init__(self):
self.start=-1
def __next__(self):
self.start +=2
if self.start >10:
raise stopiteration
return self.start
i = iterable()
for i in i:
print(i)
复制迭代器
迭代器是一次性消耗品,使用完了以后就空了,请看。
>>> l=[1,2,3]
>>> i=iter(l)
>>> for i in i:
... print(i, end='-')
...
1-2-3-
>>>next(i)
traceback (most recent call last):
file <stdin>, line 1, in <module>
stopiteration
当循环以后就殆尽了,再次使用调用时会引发stopiteration异常。
我们想通过直接赋值的形式把迭代器保存起来,可以下次使用。
但是通过下面的范例可以看出来,根本不管用。
>>> i=iter(l)
>>> j=i
>>> next(i)
1
>>> next(j)
2
>>> next(i)
3
>>> next(j)
traceback (most recent call last):
file <stdin>, line 1, in <module>
stopiteration
那怎么样才能达到我们要的效果呢?
我们需要使用copy包中的deepcopy了,请看下面:
>>> import copy
>>> i=iter(l)
>>> j=copy.deepcopy(i)
>>> next(i)
1
>>> next(i)
2
>>> next(j)
1
补充:迭代器不能向后移动, 不能回到开始。
所以需要做一些特殊的事情才能实现向后移动等功能。
以上代码均在python 3.4 中测试通过。
以上就是理解python的迭代器的内容。