当你使用f.next()迭代文件时,Python的f.tell不能像我预期的那样工作:
>>> f=open(".bash_profile", "r")
>>> f.tell()
0
>>> f.next()
"alias rm='rm -i'\n"
>>> f.tell()
397
>>> f.next()
"alias cp='cp -i'\n"
>>> f.tell()
397
>>> f.next()
"alias mv='mv -i'\n"
>>> f.tell()
397
Run Code Online (Sandbox Code Playgroud)
看起来它给你缓冲区的位置,而不是你刚接下来的位置().
我以前使用seek/tell 技巧在使用readline()迭代文件时回绕一行.使用next()时有没有办法倒回一行?
Omn*_*ous 12
不.我会制作一个很大程度上转发所有通话的适配器,但是当你做的时候保留最后一行的副本,next然后让你调用另一种方法让该行再次弹出.
我实际上会使适配器成为一个适配器,可以包装任何可迭代而不是文件的包装器,因为这听起来像在其他上下文中经常有用.
Alex的使用itertools.tee适配器的建议也有效,但我认为编写自己的迭代器适配器来处理这种情况通常会更清晰.
这是一个例子:
class rewindable_iterator(object):
not_started = object()
def __init__(self, iterator):
self._iter = iter(iterator)
self._use_save = False
self._save = self.not_started
def __iter__(self):
return self
def next(self):
if self._use_save:
self._use_save = False
else:
self._save = self._iter.next()
return self._save
def backup(self):
if self._use_save:
raise RuntimeError("Tried to backup more than one step.")
elif self._save is self.not_started:
raise RuntimeError("Can't backup past the beginning.")
self._use_save = True
fiter = rewindable_iterator(file('file.txt', 'r'))
for line in fiter:
result = process_line(line)
if result is DoOver:
fiter.backup()
Run Code Online (Sandbox Code Playgroud)
这不会太难以扩展到允许您备份超过一个值的东西.
itertools.tee可能是最糟糕的方法 - 你不能通过迭代文件来"击败"缓冲(你也不想:性能影响会很糟糕),所以保留两个迭代器,一个"一个落后于"另一个,对我来说似乎是最健全的解决方案.
import itertools as it
with open('a.txt') as f:
f1, f2 = it.tee(f)
f2 = it.chain([None], f2)
for thisline, prevline in it.izip(f1, f2):
...
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
6975 次 |
| 最近记录: |