将 bytes 可迭代对象转换为 str 可迭代对象,其中每个值都是一行

Mic*_*mza 8 python csv newline

我有一个可迭代的bytes,例如

bytes_iter = (
    b'col_1,',
    b'c',
    b'ol_2\n1',
    b',"val',
    b'ue"\n',
)
Run Code Online (Sandbox Code Playgroud)

(但通常这不会硬编码或一次性全部可用,而是由生成器提供)并且我想将其转换为可迭代的str行,其中换行符预先未知,但可以是\r,\n或中的任何一个\r\n。所以在这种情况下将是:

bytes_iter = (
    b'col_1,',
    b'c',
    b'ol_2\n1',
    b',"val',
    b'ue"\n',
)
Run Code Online (Sandbox Code Playgroud)

(但同样,就像可迭代一样,而不是一次性全部存储在内存中)。

我怎样才能做到这一点?

上下文:我的目标是将 str 行的可迭代传递给csv.reader(我认为需要整行?),但我一般对这个答案感兴趣。

o11*_*11c 6

使用该io模块为您完成大部分工作:

class ReadableIterator(io.IOBase):
    def __init__(self, it):
        self.it = iter(it)
    def read(self, n):
        # ignore argument, nobody actually cares
        # note that it is *critical* that we suppress the `StopIteration` here
        return next(self.it, b'')
    def readable(self):
        return True
Run Code Online (Sandbox Code Playgroud)

然后就打电话吧io.TextIOWrapper(ReadableIterator(some_iterable_of_bytes))

  • 对于将传递到“csv”模块的类似文件对象,应使用“newline=''”创建 TextIOWrapper,以避免将所有换行符序列转换为“\n”。(“csv”需要进行自己的换行处理,以确保正确处理引用的换行符。) (3认同)