在“for in”循环中访问迭代器

Dan*_*Bak 3 python

根据我的理解,当运行如下代码时:

for i in MyObject:
    print(i)
Run Code Online (Sandbox Code Playgroud)

MyObject 的__iter__函数已运行,for 循环使用它返回的迭代器来运行循环。

是否可以在循环中访问此迭代器对象?它是一个隐藏的局部变量,还是类似的东西?

我想做以下事情:

for i in MyObject:
    blah = forloopiterator()
    modify_blah(blah)
    print(i)
Run Code Online (Sandbox Code Playgroud)

我想这样做是因为我正在构建一个调试器,并且我需要在实例化迭代器后修改它(添加一个要在此循环期间、执行过程中迭代的对象)。我知道这是一种黑客行为,不应该以常规方式完成。直接修改 MyObject.items (迭代器正在迭代的内容)不起作用,因为迭代器仅计算一次。所以我需要直接修改迭代器。

Nik*_*s R 5

不,不可能访问这个迭代器(除非使用 Python C API,但这只是一个猜测)。如果需要,请在循环之前将其分配给变量。

it = iter(MyObject)
for i in it:
  print(i)
  # do something with it
Run Code Online (Sandbox Code Playgroud)

请记住,手动推进迭代器可能会引发StopIteration异常。

for i in it:
  if check_skip_next_element(i):
    try: next(it)
    except StopIteration: break
Run Code Online (Sandbox Code Playgroud)

的使用break是可以讨论的。在这种情况下,它具有相同的语义,但如果您想继续直到 for 块结束,continue您可以使用它。pass


aba*_*ert 5

只要您愿意依赖 Python 解释器的多个未记录的内部结构(在我的例子中为 CPython 3.7)\xe2\x80\x94,就可以做您想做的事情,但你有什么好处吗?

\n\n
\n\n

迭代器不会暴露给locals, 或其他任何地方(甚至不会暴露给调试器)。但正如 Patrick Haugh 所指出的,您可以通过 间接获得它get_referrers。例如:

\n\n
for ref in gc.get_referrers(seq):\n    if isinstance(ref, collections.abc.Iterator):\n        break\nelse:\n    raise RuntimeError(\'Oops\')\n
Run Code Online (Sandbox Code Playgroud)\n\n

当然,如果您对同一个列表有两个不同的迭代器,我不知道是否有任何方法可以在它们之间做出决定,但让我们忽略这个问题。

\n\n
\n\n

现在,你用这个做什么?你已经有了一个迭代器seq, 并且\xe2\x80\xa6 现在怎么办?您无法将其替换为有用的东西,例如itertools.chain(seq, [1, 2, 3]). 没有用于改变列表、集合等迭代器的公共 API,更不用说任意迭代器了。

\n\n

如果你碰巧知道它是一个列表迭代器\xe2\x80\xa6\xc2\xa0,那么 CPython 3.xlistiterator确实是可变的。它们被腌制的方式是创建一个空迭代器并__setstate__使用对列表和索引的引用进行调用:

\n\n
>>> print(ref.__reduce__())\n(<function iter>, ([0, 1, 2, 3, 4, 5, 6, 7, 8, 9],), 7)\n>>> ref.__setstate__(3) # resets the iterator to index 3 instead of 7\n>>> ref.__reduce__()[1][0].append(10) # adds another value\n
Run Code Online (Sandbox Code Playgroud)\n\n

但这有点愚蠢,因为只需改变原始列表就可以获得相同的效果。实际上:

\n\n
>>> ref.__reduce__()[1][0] is seq\nTrue\n
Run Code Online (Sandbox Code Playgroud)\n\n

所以:

\n\n
lst = list(range(10))\nfor elem in lst:\n  print(elem, end=\' \')\n  if elem % 2:\n    lst.append(elem * 2)\nprint()\n
Run Code Online (Sandbox Code Playgroud)\n\n

\xe2\x80\xa6 将打印出:

\n\n
0 1 2 3 4 5 6 7 8 9 2 6 10 14 18 \n
Run Code Online (Sandbox Code Playgroud)\n\n

\xe2\x80\xa6 根本不需要使用迭代器。

\n\n
\n\n

你不能用一套来做同样的事情。

\n\n

在迭代过程中改变集合会影响迭代器,就像改变列表会\xe2\x80\x94一样,但它的作用是不确定的。毕竟,集合具有任意顺序,只有在不添加或删除的情况下才能保证一致。如果中间添加或删除会发生什么?您可能会得到完全不同的顺序,这意味着您最终可能会重复已经迭代的元素,并丢失您从未见过的元素。Python 暗示这在任何实现中都应该是非法的,并且 CPython 确实检查了它:

\n\n
s = set(range(10))\nfor elem in s:\n  print(elem, end=\' \')\n  if elem % 2:\n    s.add(elem * 2)\nprint()\n
Run Code Online (Sandbox Code Playgroud)\n\n

这会立即引发:

\n\n
RuntimeError: Set changed size during iteration\n
Run Code Online (Sandbox Code Playgroud)\n\n

那么,如果我们使用同样的技巧在 Python 背后找到set_iterator并尝试更改它,会发生什么呢?

\n\n
s = {1, 2, 3}\nfor elem in s:\n    print(elem)\n    for ref in gc.get_referrers(seq):\n        if isinstance(ref, collections.abc.Iterator):\n            break\n    else:\n        raise RuntimeError(\'Oops\')\n    print(ref.__reduce__)\n
Run Code Online (Sandbox Code Playgroud)\n\n

在这种情况下您将看到类似于:

\n\n
2\n(<function iter>, ([1, 3],))\n1\n(<function iter>, ([3],))\n3\n(<function iter>, ([],))\n
Run Code Online (Sandbox Code Playgroud)\n\n

换句话说,当你腌制一个set_iterator,它会创建剩余元素的列表,并返回指令以从该列表构建新的列表迭代器。改变临时列表显然没有任何有用的效果。

\n\n
\n\n

元组怎么样?显然你不能只改变元组本身,因为元组是不可变的。但是迭代器呢?

\n\n

在 CPython 的底层,与调用“旧式序列”类型所获得的类型共享相同tuple_iterator的结构和代码,该类型定义但不减少它。listiteratoriteratoriter__len____getitem____iter__). So, you can do the exact same trick to get at the iterator, and to

\n\n

但是一旦你这样做了,ref.__reduce__()[1][0] is seq就会再次成立\xe2\x80\x94,换句话说,它是一个元组,与你已经拥有的元组相同,并且仍然是不可变的。

\n

  • @DanielPaczuskiBak `tuple_iterator` 会有不同的问题。在幕后,它的工作方式就像一个“列表迭代器”——只不过它引用的是一个元组。显然你不能改变那个元组。 (2认同)