Python:用f.next()迭代时在文件中倒带一行

gae*_*fan 10 python next seek

当你使用f.next()迭代文件时,Python的f.tell不能像我预期的那样工作:

>>> f=open(".bash_profile", "r")
>>> f.tell()
0
>>> f.next()
"alias rm='rm -i'\n"
>>> f.tell()
397
>>> f.next()
"alias cp='cp -i'\n"
>>> f.tell()
397
>>> f.next()
"alias mv='mv -i'\n"
>>> f.tell()
397
Run Code Online (Sandbox Code Playgroud)

看起来它给你缓冲区的位置,而不是你刚接下来的位置().

我以前使用seek/tell 技巧在使用readline()迭代文件时回绕一行.使用next()时有没有办法倒回一行?

Omn*_*ous 12

不.我会制作一个很大程度上转发所有通话的适配器,但是当你做的时候保留最后一行的副本,next然后让你调用另一种方法让该行再次弹出.

我实际上会使适配器成为一个适配器,可以包装任何可迭代而不是文件的包装器,因为这听起来像在其他上下文中经常有用.

Alex的使用itertools.tee适配器的建议也有效,但我认为编写自己的迭代器适配器来处理这种情况通常会更清晰.

这是一个例子:

class rewindable_iterator(object):
    not_started = object()

    def __init__(self, iterator):
        self._iter = iter(iterator)
        self._use_save = False
        self._save = self.not_started

    def __iter__(self):
        return self

    def next(self):
        if self._use_save:
            self._use_save = False
        else:
            self._save = self._iter.next()
        return self._save

    def backup(self):
        if self._use_save:
            raise RuntimeError("Tried to backup more than one step.")
        elif self._save is self.not_started:
            raise RuntimeError("Can't backup past the beginning.")
        self._use_save = True


fiter = rewindable_iterator(file('file.txt', 'r'))
for line in fiter:
    result = process_line(line)
    if result is DoOver:
        fiter.backup()
Run Code Online (Sandbox Code Playgroud)

这不会太难以扩展到允许您备份超过一个值的东西.


Ale*_*lli 5

itertools.tee可能是最糟糕的方法 - 你不能通过迭代文件来"击败"缓冲(你也不想:性能影响会很糟糕),所以保留两个迭代器,一个"一个落后于"另一个,对我来说似乎是最健全的解决方案.

import itertools as it

with open('a.txt') as f:
  f1, f2 = it.tee(f)
  f2 = it.chain([None], f2)
  for thisline, prevline in it.izip(f1, f2):
    ...
Run Code Online (Sandbox Code Playgroud)