pandas pd.read_table 是否支持 io.BytesIO 和 StringIO？

Question

pandas pd.read_table 是否支持 io.BytesIO 和 StringIO？

我有一个io.BytesIO对象，iostream它是一个从磁盘读取的 be2 文件，我要将列标题附加到 table/ iostream，

f = io.BytesIO()
f.write(b'A,B,C,D\n')
f.write(iostream.getvalue())

pd.read_table(f, sep=',', index_col=False, error_bad_lines=False, encoding='utf-8', dtype=type_map)

Run Code Online (Sandbox Code Playgroud)

但它给了我一个错误，

pandas.errors.EmptyDataError: No columns to parse from file

Run Code Online (Sandbox Code Playgroud)

我想知道如何解决这个问题。

也试过

f = io.StringIO()
f.write('A,B,C,D\n')    
f.write(iostream.getvalue().decode())

pd.read_table(f, sep=',', index_col=False, error_bad_lines=False, encoding='utf-8', dtype=type_map)

Run Code Online (Sandbox Code Playgroud)

出错

pandas.errors.ParserError: Error tokenizing data. C error: Calling read(nbytes) on source failed. Try engine='python'.

Run Code Online (Sandbox Code Playgroud)

Answer 1

mig*_*men 5

我设法重现了您的错误。您第一次尝试时遇到的问题是，在调用“pd.read_table”时，您处于流“f”的末尾，因为您刚刚写入了所有内容。'pd.read_table' 在内部调用 read()，它从您当前的位置读取。所以它返回一个空字符串。这是错误的原因：

 pandas.errors.EmptyDataError: No columns to parse from file

Run Code Online (Sandbox Code Playgroud)

解决方法很简单。您只需要使用“seek”再次移动到流的开头。这段代码对我有用：

f = io.BytesIO()
f.write(b'A,B,C,D\n')
f.write(iostream.getvalue())
f.seek(0)

pd.read_table(f, sep=',', index_col=False, error_bad_lines=False, encoding='utf-8')

Run Code Online (Sandbox Code Playgroud)

归档时间：	7 年，11 月前
查看次数：	4665 次
最近记录：	7 年，11 月前