gpt4 book ai didi

一篇文章彻底搞懂Python中可迭代(Iterable)、迭代器(Iterator)与生成器(Generator)的概念

转载 作者:qq735679552 更新时间:2022-09-28 22:32:09 26 4
gpt4 key购买 nike

CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章一篇文章彻底搞懂Python中可迭代(Iterable)、迭代器(Iterator)与生成器(Generator)的概念由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.

前言 。

在python中可迭代(iterable)、迭代器(iterator)和生成器(generator)这几个概念是经常用到的,初学时对这几个概念也是经常混淆,现在是时候把这几个概念搞清楚了.

0x00 可迭代(iterable) 。

简单的说,一个对象(在python里面一切都是对象)只要实现了只要实现了__iter__()方法,那么用isinstance()函数检查就是iterable对象; 。

例如 。

?
1
2
3
4
5
6
7
8
class iterobj:
 
  def __iter__( self ):
   # 这里简单地返回自身
   # 但实际情况可能不会这么写
   # 而是通过内置的可迭代对象来实现
   # 下文的列子中将会展示
   return self

上面定义了一个类iterobj并实现了__iter__()方法,这个就是一个可迭代(iterable)对象 。

?
1
2
3
4
it = iterobj()
print ( isinstance (it, iterable)) # true
print ( isinstance (it, iterator)) # false
print ( isinstance (it, generator)) # false

记住这个类,下文我们还会看到这个类的定义.

常见的可迭代对象 。

在python中有哪些常见的可迭代对象呢?

  • 集合或序列类型(如list、tuple、set、dict、str)
  • 文件对象
  • 在类中定义了__iter__()方法的对象,可以被认为是 iterable对象,但自定义的可迭代对象要能在for循环中正确使用,就需要保证__iter__()实现必须是正确的(即可以通过内置iter()函数转成iterator对象。关于iterator下文还会说明,这里留下一个坑,只是记住iter()函数是能够将一个可迭代对象转成迭代器对象,然后在for中使用)
  • 在类中实现了如果只实现__getitem__()的对象可以通过iter()函数转化成迭代器但其本身不是可迭代对象。所以当一个对象能够在for循环中运行,但不一定是iterable对象。

关于第1、2点我们可以通过以下来验证 。

?
1
2
3
4
5
6
7
8
9
print ( isinstance ([], iterable)) # true list 是可迭代的
print ( isinstance ({}, iterable)) # true 字典是可迭代的
print ( isinstance ((), iterable)) # true 元组是可迭代的
print ( isinstance ( set (), iterable)) # true set是可迭代的
print ( isinstance ('', iterable)) # true 字符串是可迭代的
 
currpath = os.path.dirname(os.path.abspath(__file__))
with open (currpath + '/model.py' ) as file :
  print ( isinstance ( file , iterable)) # true

我们再来看第3点, 。

?
1
2
3
4
print ( hasattr ([], "__iter__" )) # true
print ( hasattr ({}, "__iter__" )) # true
print ( hasattr ((), "__iter__" )) # true
print ( hasattr ('', "__iter__" )) # true

这些内置集合或序列对象都有__iter__属性,即他们都实现了同名方法。但这个可迭代对象要在for循环中被使用,那么它就应该能够被内置的iter()函数调用并转化成iterator对象.

例如,我们看内置的可迭代对象 。

?
1
2
3
4
print ( iter ([])) # <list_iterator object at 0x110243f28>
print ( iter ({})) # <dict_keyiterator object at 0x110234408>
print ( iter (())) # <tuple_iterator object at 0x110243f28>
print ( iter ('')) # <str_iterator object at 0x110243f28>

它们都相应的转成了对应的迭代器(iterator)对象.

现在回过头再看看一开始定义的那个iterobj类 。

?
1
2
3
4
5
6
7
class iterobj:
 
  def __iter__( self ):
   return self
  
it = iterobj()
print ( iter (it))

我们使用了iter()函数,这时候将再控制台上打印出以下信息:

traceback (most recent call last):   file "/users/mac/pycharmprojects/iterable_iterator_generator.py", line 71, in <module>     print(iter(it)) typeerror: iter() returned non-iterator of type 'iterobj' 。

出现了类型错误,意思是iter()函数不能将‘非迭代器'类型转成迭代器.

那如何才能将一个可迭代(iterable)对象转成迭代器(iterator)对象呢?

我们修改一下iterobj类的定义 。

?
1
2
3
4
5
6
7
class iterobj:
 
  def __init__( self ):
   self .a = [ 3 , 5 , 7 , 11 , 13 , 17 , 19 ]
 
  def __iter__( self ):
   return iter ( self .a)

我们在构造方法中定义了一个名为a的列表,然后还实现了__iter__()方法.

修改后的类是可以被iter()函数调用的,即也可以在for循环中使用 。

?
1
2
3
4
5
6
7
it = iterobj()
print ( isinstance (it, iterable)) # true
print ( isinstance (it, iterator)) # false
print ( isinstance (it, generator)) # false
print ( iter (it)) # <list_iterator object at 0x102007278>
for i in it:
  print (i) # 将打印3、5、7、11、13、17、19元素

因此在定义一个可迭代对象时,我们要非常注意__iter__()方法的内部实现逻辑,一般情况下,是通过一些已知的可迭代对象(例如,上文提到的集合、序列、文件等或其他正确定义的可迭代对象)来辅助我们来实现 。

关于第4点说明的意思是iter()函数可以将一个实现了__getitem__()方法的对象转成迭代器对象,也可以在for循环中使用,但是如果用isinstance()方法来检测时,它不是一个可迭代对象.

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
class iterobj:
 
  def __init__( self ):
   self .a = [ 3 , 5 , 7 , 11 , 13 , 17 , 19 ]
 
  def __getitem__( self , i):
   return self .a[i]
  
it = iterobj()
print ( isinstance (it, iterable)) # false
print ( isinstance (it, iterator)) # false
print ( isinstance (it, generator)) false
print ( hasattr (it, "__iter__" )) # false
print ( iter (it)) # <iterator object at 0x10b231278>
 
for i in it:
  print (i) # 将打印出3、5、7、11、13、17、19

这个例子说明了可以在for中使用的对象,不一定是可迭代对象.

现在我们做个小结:

  • 一个可迭代的对象是实现了__iter__()方法的对象
  • 它要在for循环中使用,就必须满足iter()的调用(即调用这个函数不会出错,能够正确转成一个iterator对象)
  • 可以通过已知的可迭代对象来辅助实现我们自定义的可迭代对象。
  • 一个对象实现了__getitem__()方法可以通过iter()函数转成iterator,即可以在for循环中使用,但它不是一个可迭代对象(可用isinstance方法检测())

0x01 迭代器(iterator) 。

上文很多地方都提到了iterator,现在我们把这个坑填上.

当我们对可迭代的概念了解后,对于迭代器就比较好理解了.

一个对象实现了__iter__()和__next__()方法,那么它就是一个迭代器对象。 例如 。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
class iterobj:
 
  def __init__( self ):
   self .a = [ 3 , 5 , 7 , 11 , 13 , 17 , 19 ]
 
   self .n = len ( self .a)
   self .i = 0
 
  def __iter__( self ):
   return iter ( self .a)
 
  def __next__( self ):
   while self .i < self .n:
    v = self .a[ self .i]
    self .i + = 1
    return v
   else :
    self .i = 0
    raise stopiteration()

在iterobj中,构造函数中定义了一个列表a,列表长度n,索引i.

?
1
2
3
4
5
6
it = iterobj()
print ( isinstance (it, iterable)) # true
print ( isinstance (it, iterator)) # true
print ( isinstance (it, generator)) # false
print ( hasattr (it, "__iter__" )) # true
print ( hasattr (it, "__next__" )) # true

我们可以发现上文提到的 。

集合和序列对象是可迭代的但不是迭代器 。

?
1
2
3
4
5
print ( isinstance ([], iterator)) # false
print ( isinstance ({}, iterator)) # false
print ( isinstance ((), iterator)) # false
print ( isinstance ( set (), iterator)) # false
print ( isinstance ('', iterator)) # false

而文件对象是迭代器 。

?
1
2
3
currpath = os.path.dirname(os.path.abspath(__file__))
with open (currpath + '/model.py' ) as file :
  print ( isinstance ( file , iterator)) # true

一个迭代器(iterator)对象不仅可以在for循环中使用,还可以通过内置函数next()函数进行调用。 例如 。

?
1
2
3
it = iterobj()
next (it) # 3
next (it) # 5

0x02 生成器(generator) 。

现在我们来看看什么是生成器?

一个生成器既是可迭代的也是迭代器 。

定义生成器有两种方式:

  • 列表生成器
  • 使用yield定义生成器函数

先看第1种情况 。

?
1
2
3
4
5
6
7
8
g = (x * 2 for x in range ( 10 )) # 0~18的偶数生成器
print ( isinstance (g, iterable)) # true
print ( isinstance (g, iterator)) # true
print ( isinstance (g, generator)) # true
print ( hasattr (g, "__iter__" )) # true
print ( hasattr (g, "__next__" )) # true
print ( next (g)) # 0
print ( next (g)) # 2

列表生成器可以不需要消耗大量的内存来生成一个巨大的列表,只有在需要数据的时候才会进行计算.

再看第2种情况 。

?
1
2
3
def gen():
  for i in range ( 10 ):
   yield i

这里yield的作用就相当于return,这个函数就是顺序地返回[0,10)的之间的自然数,可以通过next()或使用for循环来遍历.

当程序遇到yield关键字时,这个生成器函数就返回了,直到再次执行了next()函数,它就会从上次函数返回的执行点继续执行,即yield退出时保存了函数执行的位置、变量等信息,再次执行时,就从这个yield退出的地方继续往下执行.

在python中利用生成器的这些特点可以实现协程。协程可以理解为一个轻量级的线程,它相对于线程处理高并发场景有很多优势.

看下面一个用协程实现的生产者-消费者模型 。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
def producer(c):
  n = 0
  while n < 5 :
   n + = 1
   print ( 'producer {}' . format (n))
   r = c.send(n)
   print ( 'consumer return {}' . format (r))
 
 
def consumer():
  r = ''
  while true:
   n = yield r
   if not n:
    return
   print ( 'consumer {} ' . format (n))
   r = 'ok'
 
 
if __name__ = = '__main__' :
  c = consumer()
  next (c) # 启动consumer
  producer(c)

这段代码执行效果如下 。

producer 1 consumer 1 producer return ok producer 2 consumer 2 producer return ok producer 3 consumer 3 producer return ok 。

协程实现了cpu在两个函数之间进行切换从而实现并发的效果.

0x04 引用 。

docs.python.org/3.7/ 。

总结 。

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对我的支持.

原文链接:https://juejin.im/post/5ccafbf5e51d453a3a0acb42 。

最后此篇关于一篇文章彻底搞懂Python中可迭代(Iterable)、迭代器(Iterator)与生成器(Generator)的概念的文章就讲到这里了,如果你想了解更多关于一篇文章彻底搞懂Python中可迭代(Iterable)、迭代器(Iterator)与生成器(Generator)的概念的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com